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读者 在 看 过 第 1 卷 之 后 ,应 该 已 经 大 致 了 解 了 Dalvik 虚拟 机 ,包括 其 模块 组 成 .Dex 文 
件 格式 以 及 使 用 到 的 工具 。 本 书 作为 第 2 卷 ,在 第 1 卷 的 基础 上 ,将 要 细致 地 分 析 Dalvik 
内 部 的 组 成 原理 ,采用 情景 分 析 的 方式 ,有 针对 性 地 分 析 Android Dalvik 虚拟 机 的 源 代码 ， 
围绕 类 加 载 、 解 释 器 .即时 编译 ,本 地 方法 调用 内存 管 理 及 反射 机 制 等 功能 模块 逐个 击破 ， 
帮助 各 位 读者 从 微观 上 更 深入 地 理解 Dalvik 虚拟 机 中 各 功能 模块 的 实现 原理 及 运行 机 制 。 
在 其 中 展示 的 所 有 源码 ,都 来 自 于 Android 4.0.4 的 源码 ,并 在 此 基础 上 添加 了 些许 注释 ， 
以 便 理 解 源码 。 源 码 篇 幅 可 能 有 点 长 ,但 大 多 数 都 是 其 中 最 主要 的 内 容 , 如 果 读 者 手边 有 源 
码 , 可 以 对 照 着 看 ,效果 更 好 。 

此 时 ,在 翻 开 这 第 2 卷 时 ,您 手边 应 该 已 经 准备 好 了 一 个 能 正常 调试 Dalvik 的 环境 。 
现在 ,就 进入 本 卷 , 边 学 习 边 实践 , 揭 开 Dalvik 内 部 的 神秘 面纱 。 

全 书 共 分 为 6 章 : 

第 1 章 介 绍 类 加 载 机 制 ,包括 其 整体 的 工作 流程 和 机 制 ,详细 讲解 其 中 的 三 个 阶段 ,并 
以 一 个 实例 验证 了 源码 分 析 的 结果 ; 

第 2 章 介绍 Dalvik 虚拟 机 中 至 关 重要 的 内 存 管 理 机 制 ,详细 讲解 其 实现 的 两 种 算法 ; 

第 3 章 分 析 JNI 模块 的 实现 原理 ,在 分 析 源码 的 基础 上 ,细致 人 微 地 介绍 为 何 用 JNI 编 
程 会 提升 程序 的 执行 效率 ; 

第 4 章 以 反射 机 制 的 一 个 代码 示例 开始 ,介绍 其 涉及 的 API, 并 从 宏观 (实现 的 三 个 模 
块 ) 到 微观 (具体 实现 细节 ) 详 细 介 绍 了 反射 机 制 ; 

第 5 章 介 绍 实现 解释 器 的 两 种 不 同 的 技术 ,比较 Fast 解释 器 和 Portable 解释 器 的 不 同 
及 各 自 的 优势 和 劣势 ; 

第 6 章 从 介绍 最 近 在 解释 器 中 非常 火 的 JIT( 即 时 编译 ) 开 始 ,到 JIT 的 所 谓 的 前 端 分 
析 ,再 到 JIT 的 后 端 代码 生成 ,为 本 书画 上 一 个 圆满 的 句号 。 

本 书 主要 由 哈尔滨 工程 大 学 吴 艳 霞 . 张 国 印 负责 编写 ,参与 本 书 编写 和 校 核 工作 的 还 有 
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第 工 重 
类 加 载 模块 的 原理 及 实现 


本 章 内 容 提要 


如 什么 是 类 加 载 机 制 ? 

扣 类 加 载 机 制 具 有 怎样 的 功能 ? 

如 类 加 载 的 输入 输出 是 什么 ? 

避 类 加 载 机 制 的 工作 流程 是 什么 ? 

避 类 加 载 机 制 的 函数 具体 实现 是 怎样 的 ? 
所 类 加 载 机 制 是 如 何 与 解释 器 进行 交互 的 ? 


本 章 主要 围绕 以 下 6 点 问题 展开 讨论 ,1. 1 节 主 要 回答 了 什么 是 类 加 载 、 类 加 载 的 具体 
功能 以 及 机 制 的 输入 与 输出 ;1. 2 节 从 一 个 整体 宏观 的 角度 介绍 了 类 加 载 机 制 的 整体 工作 
流程 ,给 出 了 类 加 载 机 制 的 工作 阶段 划分 ;在 接 下 来 的 三 节 中 ,分 别 对 类 加 载 机 制 的 三 个 关 
键 阶段 进行 详细 的 分 析 阐 述 ,详细 讲述 了 三 个 工作 阶段 的 功能 原理 以 及 相关 的 函数 源码 分 
析 ; 最 后 一 节 将 会 通过 一 个 虚拟 机 运行 实例 ,介绍 类 加 载 机 制 的 产物 是 如 何 被 解释 器 引用 并 
执行 ,并 从 这 一 角度 展示 类 加 载 机 制 与 其 他 功能 模块 交互 的 方式 。 


1.1 类 加 载 机 制 概述 


谈 起 类 加 载 ,想必 大 多 数 读者 比较 陌生 ,类 加 载 机 制 究竟 具有 怎样 的 功能 以 及 它 在 虚拟 
机 中 是 如 何 工作 的 是 本 章 具体 讨论 的 内 容 。 

我 们 都 知道 程序 是 由 机 器 指令 和 数据 组 成 的 ,对 于 一 个 真实 的 机 器 ,通常 由 人 工 将 指令 
和 数据 交付 给 机 器 ,再 由 机 器 按照 指令 去 对 数据 进行 计算 。 但 是 对 于 虚拟 机 来 说 ,在 其 模拟 
真实 机 器 执行 程序 之 前 ,需要 一 种 加 载 机 制 将 程序 的 指令 和 数据 装载 进入 虚拟 机 内 部 的 运 
行 时 环境 ,使 虚拟 机 中 的 执行 模块 可 以 根据 程序 执行 的 需要 随时 取得 目标 指令 和 相关 数据 ， 
以 完成 程序 的 执行 任务 。 对 于 Java 虚拟 机 而 言 ,这 一 种 将 类 数据 装载 进入 虚拟 机 运行 时 环 
境 的 过 程 就 称 为 类 加 载 。 具 体 到 Dalvik 虚拟 机 ,类 加 载 机 制 的 主要 功能 就 是 将 应 用 程序 中 
Dalvik 操作 码 以 及 程序 数据 提取 并 加 载 到 虚拟 机 内 部 ,以 保证 程序 的 正确 运行 。 

类 加 载 机 制 在 应 用 程序 和 执行 模块 之 间 建 立 起 了 一 个 桥梁 ,对 于 整个 Dalvik 虚拟 机 架 
构 来 说 ,类 加 载 机 制 处 在 一 个 承上启下 的 位 置 。 图 1.1 反映 了 类 加 载 机 制 在 Dalvik 虚拟 机 
执行 过 程 中 所 承担 的 重要 作用 。 

类 加 载 机 制作 为 Dalvik 虚拟 机 一 个 重要 的 功能 模块 ,其 输入 输出 是 什么 呢 ? 在 第 1 卷 
第 3 章 中 ,已 经 对 Dex 文 件 进 行 了 介绍 ,在 此 就 不 再 歼 述 。 简 单 来 说 ,Dex 文件 就 是 Android 
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应 用 程序 的 可 执行 文件 ,里 面 封装 了 Dalvik 字 节 码 以 及 程序 数据 ,而 类 加 载 机 制 就 是 负责 
提取 装载 Dex 文件 中 的 指令 与 数据 。 因 此 ,Dex 文件 是 Dalvik 虚拟 机 的 输入 文件 ,更 是 类 
加 载 机 制 的 主要 处 理 对 象 。 既 然 Dex 文件 是 类 加 载 机 制 的 输入 文件 ,那么 类 加 载 机 制 的 输 
出 又 是 什么 呢 ? 事实 上 ,类 加 载 机 制 的 输出 是 一 个 名 为 ClassObject 的 数据 结构 实例 对 象 ， 
类 加 载 将 目标 类 的 各 项 资源 数据 与 ClassObject 数据 结构 下 的 各 个 成 员 变 量 以 指针 的 形式 
进行 关联 ,执行 模块 只 需 通 过 该 数据 结构 即 可 获得 目标 类 所 有 的 运行 时 数据 ,使 程序 的 顺利 
执行 成 为 可 能 。 


开始 | -美加 载 机 制 | 
| 优化 验证 Dex 1 
| | | 文件 类 数据 | 1! 
虚拟 机 运行 时 | 1 了 | 
环境 初始 化 | 解析 装载 Dex 
】 ! 文件 | 
| 1 
解析 虚拟 机 1 | 加 载 类 数据 至 运行 ] | 
启动 参数 | | “时 数据 结构 “| ! 
| | 
1 于 计生 省 | 1 
初始 化 虚拟 机 执行 程序 字 节 
运行 进程 码 流 


0 结束 


1.1 Dalvik 虚拟 机 程序 执行 流程 图 


点 拨 ”程序 是 由 指令 序列 组 成 的 ,告诉 计算 机 如 何 完成 一 个 具体 的 任务 。 程 序 是 软件 开发 
人 员 根 据 用 户 需 求 开发 的 、 用 程序 设计 语言 描述 的 适合 计算 机 执行 的 指令 (语句 ) 序 列 。 而 对 于 
Dalvik 虚拟 机 来 说 , 它 所 能 “ 读 懂 " 的 指令 是 Dalvik 操作 码 , 其 介绍 可 以 参见 第 1 卷 第 3 章 。 


1.2 类 加 载 机 制 整 体 工作 流程 介绍 


在 了 解 了 类 加 载 机 制 的 主要 功能 以 及 输入 输出 产物 后 ,我们 不 禁 要 问 ,类 加 载 机 制 在 工 
作 过 程 中 主要 有 哪儿 项 关键 工作 以 及 其 工作 流程 又 是 什么 ? 经 过 对 类 加 载 机 制 源码 的 分 析 
研究 ,类 加 载 机 制 工 作 的 主要 内 容 以 及 其 整体 的 工作 流程 主要 分 为 以 下 三 点 。 

(1) 对 Dex 文件 进行 验证 并 优化 ,验证 的 目的 是 对 Dex 文件 中 的 类 数据 进行 安全 性 、 
合法 性 检验 ,为 虚拟 机 的 安全 稳定 运行 提供 保证 ;而 优化 的 目的 则 是 根据 当前 设备 平台 特性 
对 程序 中 的 字 节 码 进 行 优化 蔡 换 并 为 Dex 文件 增加 辅助 信息 ,最 后 输出 经 过 优化 的 Odex 
文件 ,使 之 可 以 代替 原 有 的 Dex 文件 更 加 高 效 地 被 虚拟 机 执行 。 

(2) 对 优化 后 的 Odex 文件 进行 解析 ,其 目标 就 是 通过 在 内 存 中 创建 专用 的 数据 结构 描 
述 表示 该 Odex 文件 ,使 虚拟 机 对 目标 Odex 文件 中 各 个 部 分 的 类 数据 都 是 可 达 的 ,为 随后 
实际 加 载 某 一 指定 类 做 好 数据 准备 。 

(3) 对 指定 类 进行 实际 加 载 ,其 功能 是 实时 根据 Dalvik 虚拟 机 执行 需要 从 已 被 解析 的 
Dex 文件 中 提取 二 进 制 Dalvik 字 节 码 并 将 其 封装 进 运 行 时 数据 结构 ,以 供 解释 器 解释 执 
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行 。 而 该 运行 时 数据 结构 实际 上 是 一 个 ClassObject 结构 体 对 象 ,也 称 为 类 对 象 , 该 数据 结 
构 用 于 封装 程序 类 的 所 有 运行 时 数据 信息 。 当 虚拟 机 执行 一 个 类 方法 时 ,解释 器 将 引用 并 
执行 类 对 象 中 封装 的 方法 操作 码 ,进而 达到 完成 程序 要 求 的 执行 目标 。 由 此 可 见 ,类 对 象 实 
例 在 程序 运行 的 过 程 中 承担 着 不 可 替代 的 重要 作用 。 

图 1. 2 简要 描述 了 类 加 载 机 制 的 整体 工作 流程 。 


输入 Dex 文 件 优化 。 Dex 文 件 解 析 加 载 目标 类 输出 
1 
| ClasslH | Class 1 的 运行 时 
| 天 加 全 基站 数据 结构 
1 工 1 慑 
1 |Class2H 1 Class 2 的 运行 时 
a 1— | 加 过 数据 结构 
Dex 文 件 Yi NL Bk | Fm 
| | |: EP 
1 
1 1 i 
加 载 类 Class 4 的 运行 时 
| Er | 方法 数据 结构 
1 2 人 
| 


1.2 类 加 载 机 制 整体 工作 概况 图 


在 随后 的 内 容 中 将 分 别 从 Dex 文件 的 优化 与 验证 .Dex 文件 解析 以 及 类 的 实际 加 载 等 
三 方面 (关键 内 容 ) 展 开 介绍 ,以 帮助 读者 对 类 加 载 机 制 的 整体 功能 ,设计 原理 以 及 函数 工作 
流程 有 一 个 较为 深入 的 理解 。 


1.3 Dex 文件 的 优化 与 验证 


事实 上 ,Dex 文件 中 类 数据 的 优化 与 验证 是 Dex 文件 解析 工作 的 一 部 分 ,但 由 于 该 优 
化 与 验证 工作 在 Dalvik 虚拟 机 中 被 前 置 , 使 之 成 为 Dalvik 区 别 于 其 他 Java 虚拟 机 的 重要 
特征 ,因此 这 部 分 工作 具有 较 高 的 重要 性 ,其 工作 效果 的 好 坏 在 一 定 程度 上 决定 了 Dalvik 
虚拟 机 是 否 可 以 高 效 安全 地 运行 ,因此 本 书 特 将 这 部 分 内 容 抽 取出 来 单独 介绍 。 同 时 ， 
Dalvik 虚拟 机 的 优化 技术 一 直 是 业界 关注 的 焦点 ,如 何 进 一 步 提 高 Dalvik 虚拟 机 在 柑 入 式 
设备 上 的 性 能 表现 应 该 是 未 来 工程 开发 人 员工 作 的 重点 。 

在 这 一 节 中 ,主要 讲解 了 Dex 文件 的 优化 与 验证 技术 的 设计 原理 .关键 数据 结构 以 及 
其 函数 执行 流程 。 希望 通过 对 这 三 方面 内 容 的 介绍 ,可 以 让 读者 由 表 及 里 地 了 解 该 技术 的 
功能 原理 以 及 具体 实现 。 


1.3.1 Dex 文件 优化 验证 的 原理 与 实现 


依据 Google 提供 的 开发 文档 的 描述 ,在 通常 情况 下 ,优化 和 验证 Dex 文件 最 安全 且 最 
便捷 的 方式 就 是 在 虚拟 机 中 直接 加 载 目标 Dex 文件 并 运行 其 中 包含 的 所 有 类 ,因为 一 旦 加 
载 失 败 或 是 运行 失败 ,就 意味 着 Dex 文件 优化 验证 的 失败 。 因 此 ,虚拟 机 究竟 是 使 用 何 种 
方法 ,以 较为 高 效 的 手段 实现 了 对 Dex 文件 的 验证 与 优化 ,这 将 是 一 个 非常 值得 深入 研究 
的 问题 。 为 了 得 到 最 为 直观 、 真 实 的 结论 ,需要 从 Android 源码 入 手 ,以 彻底 和 弄 清 问题 的 
本 质 。 
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根据 对 优化 机 制 的 源码 研究 发 现 : Dalvik 虚拟 机 的 优化 验证 工作 独立 于 程序 的 执行 ， 
同时 优化 验证 这 两 部 分 功能 也 被 整合 成 为 一 个 功能 模块 并 且 类 加 载 机 制 在 加 载 工作 的 初期 
通过 类 似 接口 调用 的 方式 调用 这 个 优化 模块 对 目标 Dex 文件 进行 优化 。 为 了 解决 资源 占 
用 问题 ,Android 系统 将 会 新 建 一 个 虚拟 机 用 于 实现 相应 的 功能 ,在 Dex 文件 的 优化 验证 工 
作 结 束 并 正常 输出 优化 文件 后 ,系统 将 释放 该 虚拟 机 占用 的 所 有 资源 。 

同时 ,为 了 更 大 程度 地 保证 原 Dex 文件 的 数据 的 安全 以 及 优化 机 制 的 独立 性 ,优化 机 
制 并 不 直接 改写 原 Dex 文件 ,而 是 重新 创建 一 个 后 组 为 . Odex 的 空 文件 并 以 严格 的 格式 要 
求 将 所 有 的 优化 信息 写 入 该 文件 ,主要 包括 依赖 库 关系 、 寄 存 器 映射 关系 以 及 类 的 索引 关 
系 , 这 些 关 系 的 建立 会 大 大 提高 类 加 载 机 制 的 执行 效率 ,同时 ,在 优化 过 程 中 还 会 根据 平台 


= 特性 对 原 Dex 文件 中 部 分 字 节 码 进 行 奉 换 (例如 ， 

将 优化 后 的 Dax 文件 | 对 字段 的 访问 方式 由 查找 改 为 直接 引用 ) 以 提高 
写 入 Odex 文 件 | 程序 执行 速率 ,最 后 再 将 重 写 的 Dex 文件 也 写 入 

A EE Od 文件 (1. 3. 2 节 将 详细 介绍 Odex 叶肉 
a 依赖 库 信息 以 及 各 部 分 功能 )。Odex 文件 作为 优化 机 制 的 输 
成 相应 的 头 部 信息 1 出 将 会 取代 原 Dex 文件 并 作为 直接 的 可 执行 文件 


写 和 Dx 文件 辅助 | 被 其 他 功能 模块 (例如 ,内 存 管理 模块 、 解 释 器 模 
设置 优化 验证 块 等 ) 调 用 。Dex 文件 的 优化 机 制 大 致 的 工作 流 


模式 
保存 并 修改 Odex < 
流 件 关 部 信息 ”| 程 如 图 1. 3 所 示 。 | 
汪汪 人 全 仆人 Dex 文件 的 优化 与 验证 机 制 在 Dalvik 虚拟 机 
下 中 被 设计 成 一 个 独立 的 系统 工具 ,这 样 做 的 好 处 
图 1.3 优化 机 制 工作 流程 图 是 使 该 机 制 具有 比较 高 的 独立 性 ,使 整个 机 制 模 


块 性 更 好 ,在 一 定 程 度 上 降低 了 整个 Android 系 
统 的 宛 余 。 同 时 ,也 提供 了 一 个 技术 参考 ,在 适应 低 性 能 的 移动 平台 时 ,应 该 尽量 采用 这 种 
优化 手段 以 提高 效率 。 
点 拨 Android 设备 在 第 一 次 启动 程序 时 往往 耗费 较 长 的 时 间 , 实 际 上 ,在 这 期 间 虚 拟 
机 对 目标 Dex 文件 进行 了 验证 与 优化 ,并 为 之 生成 了 相应 的 Odex 文件 。 当 用 户 再 次 启动 
应 用 程序 时 ,新 生成 的 Odex 文件 将 会 代替 原 有 的 Dex 的 文件 被 虚拟 机 引用 执行 ,由 于 不 需 
要 再 次 对 程序 数据 进行 验证 优化 , 极 大 地 缩短 了 启动 时 间 。 


1.3.2 Odex 文件 结构 分 析 


直观 上 Odex 文件 在 Dex 文件 的 原 有 结构 上 进行 了 扩充 , 即 在 Dex 文件 前 拼接 了 Odex 
文件 头 部 信息 ,还 在 Dex 文件 尾部 拼接 了 依赖 库 、 寄 存 器 映射 关系 以 及 类 的 哈 希 索引 等 辅 
助 信息 。 其 结构 对 比如 图 1.4 所 示 。 

通过 Odex 文件 的 头 部 信息 可 以 更 好 地 了 解 一 下 Odex 的 文件 结构 以 及 各 部 分 数据 含 
义 , 表 1.1 为 Odex 文 件 头 DexOptHeader 在 Dexfile.h 文件 中 的 定义 。 

在 表 1. 1 中 ,DexOptHeader 结构 中 的 magic 字段 与 DexHeader 结构 中 的 magic 字段 
类 似 , 都 是 用 于 标识 文件 ;dexOffset 字段 表示 原 Dex 文件 起 始 位 置 的 偏 移 量 ,实际 上 它 就 
等 于 DexOptHeader 结构 体 的 大 小 0x28; dexLength 字段 表示 Dex 文件 的 总 长 度 , 通 过 这 
两 个 字段 可 以 非常 快速 定位 并 读 取 Dex 文件 ;depsOffset 字段 表示 依赖 库 起 始 的 偏 移 量 ; 
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depsLength 表示 依赖 库 的 总 长 度 ;optOffset 字段 表示 优化 数据 的 起 始 偏 移 量 ;optLength 
字段 表示 优化 信息 的 总 长 度 ,而 对 于 类 加 载 机 制 非常 关键 的 类 索引 信息 就 封装 在 这 部 分 优 
化 信息 中 ;flags 字段 为 一 个 标识 ,其 用 于 标示 Dalvik 虚拟 机 加 载 Odex 文件 时 优化 与 验证 
选项 ;checksum 字段 为 Odex 文件 的 校 验 和 。 


表 1.1 DexOptHeader 数据 结构 定义 


变量 类 型 | 变量 名 称 描述 
ul magic[8] Odex 文件 版 本 标识 
u4 dexOffset Dex 文件 头 偏 移 量 
u4 dexLength | Dex 文件 总 长 度 
ET De 4 | depsOffset | odex 文 件 依赖 库 列表 偏 移 量 
ea 件 关 部 | u4 | depsLength | 依赖 库 信息 总 长 度 
内 部 数据 索引 | 喇 2s 交 件 4 | optOffset | 优化 数据 信息 偏 移 量 
Dex 文 件数 据 区 依赖 库 信息 ud4 optLength | 优化 数据 总 长 度 
辅助 信息 u4 | flags 标识 位 
1.4 Dex 文 件 与 Odex 文 件 结构 对 比 图 。 一 heeum 文件 术 验 和 


通过 这 个 头 部 信息 ,虚拟 机 可 以 非常 高 效 地 查找 Dex 文件 中 的 各 类 信息 , 极 大 提高 了 
执行 效率 ,另外 ,Dalvik 虚拟 机 对 Dex 文件 所 进行 的 优化 工作 主要 体现 在 依赖 库 和 辅助 信 
息 两 部 分 上 ,因此 ,下 文 将 会 对 这 两 部 分 内 容 的 功能 进行 介绍 。 

1. 依赖 库 信息 


依赖 库 顾名思义 ,就 是 指 该 Dex 文件 所 需要 链接 的 本 地 函数 库 , Dalvik 虚拟 机 在 程序 
执行 前 期 通过 优化 机 制 将 这 部 分 整合 到 Odex 文件 中 ,可 以 在 一 定 程度 上 提高 程序 的 执行 
效率 , 表 1. 2 为 依赖 库 Dependence 结构 体 定义 。 


表 1.2 Dependence 数据 结构 定义 


变量 类 型 变量 名 称 描 述 
ud modWhen 时 间 戳 
u4 crc 校 验 信息 
ud DALVIK_VM_BUILD 虚拟 机 版 本 号 
于 numDeps 依赖 库 个 数 
u4 len Name 长 度 
ud name[ len| 依赖 库 名 称 
KSHA1DigestLen signature SHA-1 值 


在 表 1. 2 中 ,modWhen 用 来 记录 Dex 文件 优化 前 的 时 间 戳 ,crc 为 Dex 文件 优化 前 的 
crc 校 验 值 ,DALVIK_VM_BUILD 值 表示 的 是 虚拟 机 版 本 号 ;不 同 版 本 的 Android 系统 定 
义 不 同 ,例如 , Android 2. 2. 3 为 19、Android 2. 3 为 23 以 及 Android 4. 0. 4 则 为 27。 
numDeps 字段 所 代表 的 含义 为 该 Dex 文件 的 依赖 库 个 数 , 其 中 table 结构 体 的 个 数 正 是 由 
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numDeps 决定 的 ,也 可 以 理解 为 每 个 依赖 库 都 对 应 一 个 table 结构 体 对 象 , 在 该 结构 体 中 ， 
len 表示 依赖 库 名 称 的 长 度 ,name 为 依赖 库 名 以 及 signature 表示 SHA-1 签名 。 


2. 类 索引 信息 


类 索引 信息 的 建立 是 优化 机 制 的 重要 工作 之 一 ,在 该 索引 表 中 ,优化 机 制 为 Dex 文件 
中 的 每 一 个 类 配置 了 一 个 table 结构 体 对 象 ,在 这 个 对 象 中 记录 了 类 描述 符 哈 希 值 .类 描述 
符 在 Dex 文件 中 偏 移 地 址 以 及 类 定义 区 的 偏 移 地 址 ,类 加 载 机 制 通过 这 些 信息 可 以 非常 快 
速 地 定位 类 资源 地 址 并 加 载 类 。 同 时 ,通过 哈 希 查找 的 方式 极 大 地 提高 了 类 加 载 机 制 的 查 
找 效率 , 表 1. 3 为 DexClassLookup 结构 体 定义 。 


表 1.3 DexClassLookup 数据 结构 定义 


变量 类 型 变量 名 称 描 述 
int size 表 大 小 
int numEntries 表 项 入 口 数 量 
ud classDescriptorHash 类 描述 符 的 喻 希 值 
u4 classDescriptorOffset Dex 文件 中 该 类 描述 符 的 偏 移 位 置 
u4 classDefOffset Dex 文件 中 该 类 定义 偏 移 位 置 


在 表 1. 3 中 ,numEntries 是 一 个 比较 特别 的 数目 , 它 虽 然 表 示 的 是 表 的 项 数 ,但 实际 上 
这 个 数值 是 通过 dexRoundUpPower2() 函 数 生成 。 

点 拨 dexRoundUpPower2() 函 数 是 源 自 斯 坦 福 大 学 的 一 个 算法 一 一 用 于 求 比 一 个 数 大 
的 最 小 的 2 的 整数 次 办 ,例如 ; 当 数 为 6 时 ,该 算法 计算 得 到 8。 这 样 做 的 结果 会 比 Dex 文 件 
中 类 的 数量 大 ,但 好 处 是 降低 了 哈 希 冲突 率 。 


1.3.3 函数 执行 流程 


Dex 文件 的 优化 始 于 Android 源码 中 frameworks 层 的 PackageManagerService 类 ,该 
类 实际 上 是 通过 Installer 类 实现 对 apk 文件 的 安装 .优化 以 及 御 载 等 工作 。 而 Installer 类 
通过 与 c 层 的 installd 建立 socket 连接 ,使 得 在 上 层 的 install .remove、dexopt 等 功能 最 终 
由 installd 在 底层 实现 。 在 installd 中 ,do_dexopt 函数 负责 完成 对 Dex 文件 的 优化 ,而 do_ 
dexopt 函数 将 会 调用 dexopt 函数 去 完成 实际 的 优化 工作 。 在 dexopt 函数 中 ,首先 完成 一 
些 必要 的 准备 工作 ,比如 声明 关键 变量 ,分 析 文 件 路 径 ,而 最 关键 的 是 创建 了 一 个 空 文件 并 
以 Odex 后 级 结尾 ,由 此 ,可 以 认定 dexopt 函数 用 于 产生 Odex 文件 ,在 完成 准备 工作 后 ,将 
会 委托 run_dexopt 函数 完成 实际 的 优化 工作 。 

在 run_dexopt 函数 中 ,可 以 看 到 这 样 一 行 代码 : 


execl (LEX_OPT BIN,TEX OPT BIN,"- zip",zip num,Odex numjinput file name,dexopt flags, (char* ) NULD); 


run_dexopt 函数 通过 使 用 Execl 函数 将 优化 工作 委托 给 了 由 第 一 参数 DEX_OPT_BIN 
宏 定 义 所 指出 的 可 运行 程序 ,DEX_OPT_BIN 宏 定 义 的 内 容 是 : 


Static const har* TEX OPT BINF "/system/bin/dexopt"; 
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而 /system/bin/dexopt 中 的 dexopt 程序 的 源码 位 于 Android 系统 源码 的 dalvik\ 
dexopt 目录 下 ,从 目录 结构 上 即 可 反映 出 dexopt 优化 程序 是 Dalvik 虚拟 机 下 第 一 级 子 程 
序 , 也 正 说 明 优 化 机 制 在 Dalvik 虚拟 机 中 确实 为 一 个 相对 独立 的 功能 模块 。 

在 清楚 了 优化 机 制 的 源头 后 ,dexopt 优化 程序 的 工作 流程 成 为 我 们 比较 关注 的 一 个 问 
题 ,因此 ,本 文 将 在 此 着 重 分 析 优 化 机 制 的 具体 实现 过 程 并 介绍 优化 机 制 中 关键 的 技术 点 以 
及 有 代表 性 的 实现 细节 。 

dexopt 的 主 程序 代码 位 于 dalvik\dexopt\OptMain. cpp 文件 中 ,其 中 extractAndProcessZip() 
函数 用 于 处 理 并 优化 apk/jar/zip 文件 中 的 classes. dex, 因 此 该 函数 将 作为 优化 机 制 的 主 控 函 
数 ,extractAndProcessZip() 函 数 的 实现 代码 如 下 。 

代码 清单 1.1 dalvik\dexopt\OptMain. cpp:extractAndProcessZip() 函 数 源 代码 

static int extractAndProoessZip( int ziprd, int caheFd, const charx dgbugFileName,bool isBootstrap, const 

char* bootclassPath,const charx dexoptFlagstr) 

{ 

/* 函数 在 执行 初期 声明 相关 的 中 间 变 量 * / 


ZipArchive zippy; // 用 于 描述 ZIP 压 缩 文件 的 数据 结构 

ZipEntry zipEntry; // 用 于 表示 一 个 ZIP 入 口 

off t dexoffset; // 用 于 表示 在 0dex 文 件 中 , 原 Dax 文件 的 起 始 地 址 
int err; // 标 示 符 

int result= 一 17 1/ 函数 返回 值 

int dexoptF1ags= 0; // 优 化 标示 符 


/# 设置 默认 的 优化 模式 * / 
DexclassVerifyMpde verifyMpde= VERIFY MDDE ALL; 
DexOptimizerMpde dexoptMbde= OPTIMIZE MDDE VERIFTED; 
memset (&zippy, 0, sizeof (zippy)); // 对 zippy 对 象 进行 置 0 操作 
/* 对 和 人口 参数 caheFd 文 件 描述 符 所 代表 的 输入 文件 进行 为 空 判断 ,该 文件 必须 保证 为 空 ,因为 
在 后 期 要 将 优化 后 的 数据 写 入 该 文件 中 x* / 
if (1seek(cacheFd, 0, SEEK FND) !=0) { 
IOGE ("DexOptZ: new cache file '%s' is not empty", debugFileName); 
goto bail; 
} 
/* 当 cacheFd 所 指 文件 为 空 ,那么 为 其 创建 一 个 ouex 文 件 的 头 部 * / 
err= GexOptCreateFmptyHeader (cacheFd) ; 
if (err (=0) // 对 函数 执行 结果 进行 判断 ,如 果 失 败 则 将 返回 
goto bail; 
/* 取得 odex 文 件 中 原 Dax 文 件 的 起 始 位 置 ,实际 就 是 一 个 odex 文 件 头 部 的 长 度 ,并 将 结果 赋值 给 
变量 dexoffset* / 
dexOffset= 1seek (cacheFd, 0, SFEK CUR) 7 
if (dexoffset< 0) 
goto bail; 
/* 打开 ZIP 对 象 ,在 其 中 查找 目标 Dax 文 件 */ 
证 (GexzipPrepArchive (ziprd, dspugpi leName, &zippy) (=0) { 
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IOGW("Dexoptz: unable to open zip archive '%s"",GebugFileName); 
goto bail; 

} 

/* 获取 目标 Dex 文 件 的 解压 人 口 */ 

zipEntry= dexzipFindentry (&zippy, KClassesDex) ; 

if (zipentry==NOLL) { 
IOGW("DexOptZ: zip archive '%s' does not include $s", 

debugFi leName, kKC1assesDex) ; 

goto bail; 

/* 获取 相关 ZIP 入 口 信息 * / 

if (dexzipGetEntryInfo (&zippy, zipEntry, NILL, gnomplen, NOLL, 

NULL, Smpdqhen, &crc32) !=0) 


IOGW("Dexopt2: zip archjve GetEntryInfo failed on %s", 
debugFileName)7 
goto bail; 
} 


/* 从 ZIP 文 件 将 目标 Dax 文件 解压 出 来 ,并 写 入 cacheFa 所 指 文件 ,此 时 casheFd 所 指 文件 非 空 , 包 
括 一 个 odex 文 件 头 部 加 上 一 个 原始 的 Dex 文 件 * / 
if (dexzipExtractEntryToFile (£2ippy, zipEntry, cadheFd) !=0) { 
IOGW("DexOpt2: extraction of %s from %s failed", 
kClassesDex, debugFi leName) ; 
goto bail; 
4 
/* 根据 入 口 参 数 dexoptFlagstr, 对 验证 优化 需求 进行 分 析 ,dexoptFlagstr 
实际 上 是 一 个 字符 串 ,记录 了 验证 优化 的 要 求 * / 
if (dexoptFlagstr[0]!="\0') { 
const har* apc; 
const har* val; 
/# 设置 验证 模式 * / 
apc= strstr (dexoptFlagStr, = "); /* VErificaticn */ 
if (pc =NULD) { 
Switch (x* (opc+ 2)) { 


Case 'n': verifyMpde=VERIFY MDDE NONE; break; 
case 'r': verifyMbde= VERIFY MDDE REMOTE; break; 
Case 'a': verifyMpde= VERIFY MDDE ALL; break; 
Gefault: break; 


} 
} 

/= 设置 优化 模式 < / 

pe=strstr(GexoptFlagstr,"o="); /x* cptimization * / 
证 pc =NOD) { 
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Switch (x* (cpc+ 2)) { 


Case 'n': dexoptMpde= OPTIMIZE, MDDE NONE; break; 
Case 'V': dexOptMode= OPTIMIZE, MDDE VERIFTED; break; 
Case 'a': dexOptMode= OPTIMIZE, MDDE ALL; break; 
case 'f': dexoptMpde= OPTIMIZE, MDDE FULL; break; 
Gefault: break; 


3 


} 
/* 当 完 成 了 原 Dex 文 件 的 提取 以 及 验证 优化 选项 的 设置 , 即 可 以 开始 真正 的 优化 工作 ,需要 初始 化 
一 个 虚拟 机 专门 用 于 验证 优化 工作 * / 
证 (dmPrepForDexOpt (bootClassPath, dexOptMpde, verifyMpde, 
dexoptF1ags) !=0) 
{ 
IOGE ("DexOptz: WM init failed"); 
goto bail; 
} 
/* 调用 dumcontinueoptimization 函数 完成 对 Dex 文 件 的 验证 与 优化 工作 * / 
if (!dvrcontinueoptimization (cacheFd,dexoffset,uncorpLen 
debugFileName,mpdnhen,crc32,isBootstrap)) 
{ 
IOGE ("Optimi zation failed") ; 


goto bail; 
’ 
result= 0; // 设 置 返回 值 ,0 表示 成 功 
retum result; 1/ 函数 返回 } 


从 上 面 的 源码 中 可 以 看 到 ,extractAndProcessZip( ) 函数 首先 会 调用 dexOptCreate- 
EmptyHeader() 函 数 为 Odex 文件 创建 一 个 文件 头 用 于 描述 Odex 文件 内 容 ,随后 主 函数 将 
调用 dexZipFindEntry() 函 数 检查 目标 文件 中 是 否 拥 有 classes. dex 文件 ,如 果 目 标 Dex 文 
件 存 在 , 则 通过 dexZipGetEntryInfo( ) 函数 读 取 Dex 文件 相关 的 验证 信息 ,接着 调用 
dexZipExtractEntryToFile() 函 数 提取 classes. dex 文件 并 写 和 人 Odex 文件 ,在 写 和 人 完毕 后 ， 
主 程序 将 会 根据 入 口 参 数 dexoptFlagStr 解析 检验 与 优化 模式 并 将 优化 选项 dexOptMode 
与 验证 verifyMode 写 人 到 全 局 变量 中 。 至 此 ,优化 机 制 的 准备 工作 基本 结束 。 

在 准备 工作 完成 后 , 主 函 数 调用 dvmPrepForDexOpt() 启 动 并 初始 化 一 个 虚拟 机 进程 ， 
而 以 后 的 所 有 优化 操作 都 会 在 这 个 进程 中 完成 , 当 Odex 文件 正常 输出 后 ,这 个 进程 的 所 有 
资源 都 会 被 释放 。 当 优化 的 进程 准备 完毕 后 , 主 函数 将 调用 dvmContinueOptimization( ) 函 
数 开始 真正 的 验证 与 优化 工作 。 

点 所 ”启用 一 个 专门 的 进程 用 于 负责 Dex 文件 的 优化 与 验证 ,这 样 做 的 好 处 是 在 一 定 
程度 上 保证 了 虚拟 机 的 安全 运行 ,因为 一 个 未 经 安全 验证 的 程序 ,不 能 保证 对 其 他 虚拟 机 进 
程 绝 对 安全 。 例 如 ,恶意 自 改 共享 数据 .造成 内 存 溢 出 等 。 
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代码 清单 1.2 dalvik\vmNanalysis\DexPrepare. cpp :dvmContinueOptimization( ) 函 
数 源 代码 


bool dumcontinueoptimizaticn (int fd,off t dexoffset, long dexLength, 
const har* fileName,u4 mpdwhen,u4 crc,bool isBootstrap) 


/* 声明 相关 中 间 变 量 * / 
DexClassLookup* pClassLookup= NULL; 
RegisterMapBuilder * pRegqvapBuilder=NULL; 


assert (gDvm.optimizing); 
IOW ("Continuing optimization (%s,isb=%d)",fileName,isBootstrap); 
assert (dexOffset >=0); // 判 断 输 入 文件 长 度 非 0 


/# 对 目标 文件 进行 合法 性 检验 * / 
if (dexLength< (int) sizeof (DexHeader)) { 
/* 一 个 Dex 文 件 的 长 度 不 能 小 于 其 文件 头 的 长 度 * / 
IOGE ("too small to be DEX"); 
retum false; 
} 
/* Odex 文 件 中 的 Dex 文 件 的 起 始 偏 移 量 不 能 小 于 odex 文 件 头 的 长 度 * / 
if (dexoffset< (int) sizeof (DexoOptHeader)) { 
IOGE ("not enough rocm for apt header") 7 
retum false; 


/* 将 乌 所 指 文件 映射 到 某 一 位 置 ,该 位 置 的 起 始 地 址 为 mapncdr, 其 大 小 就 为 码 所 指 文件 大 
小 , 即 一 个 odex 文 件 头 部 加 上 一 个 Dax 文件 长 度 * / 

mapAddr= rmap (NULL, GexOf fset+ dexIength, 
EROT FREAD| FROT. WRITE, MAP SHARED, fd,0); 

证 (apnodr==MAP FRIED) { 
IOGE (“unable to mmap DEX cache: $s",strerror (ermo)); 
goto bail; 

+ 

/* 设置 相关 的 优化 验证 选项 x* / 

bool goverify, doopt; 

if (gpwm.classVerifyMbde==VERIFY MDDE NONE) { 
doVerify= false; 

} else if (gpvum.classVerifyMpde==VERIFY MODE REMOTE) { 
doVerify= !gpvm.optimizingpootstrapClass; 

} else /* if (gpum-classVerifyMpde==VERIFY MODE ALD)* / { 
GoVerify= true; 

} 

if (gpm.dexOptMpde==OPTIMIZE MODE NONE) { 
Goopt false; 

} else if (gpvm-dexoptMpde==OPIIMIZE MDDE VERIFIED || 
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gpm.dexOptMode== OPTIMIZE, MODE FULL) { 
coopt= doverify; 
} else /* if (gpm.dexOptMode==OPTIMIZE MODE MD < /{ 
coopt= true; 
/* 调用 rewritepex 函数 对 目标 文件 进行 优化 验证 ,其 主要 内 容 包括 : 字符 顺序 调整 . 字 节 码 
蔡 换 、 字 节 码 验证 以 及 文件 结构 重新 对 齐 * / 
Success= rewriteDex( ( (ul * ) maphodr)+ dexOffset, dexIength, 
coverify, doopt, gpclassIookup, NOLD) ; 
/* 对 当前 文件 进行 8 字 节 对 齐 ,并 准备 写 人 * / 
off t depsoffset,aptOffset,endoffset,adjOffset; 
u4 aptchecksum 
depsOffset= lseek (fd,0,SEEK FND); // 取 得 乌 所 指 文件 的 总 长 
if (depsoffset< 0) { 
IOGE ("lseek to EOF failed: %s", strerror (errmo)); 
goto bail; 
} 
/* 根据 乌 所 指 文件 总 长 使 gspsoffset (dependency list 的 起 始 地 址 ) 为 8 的 倍数 (adjoffset 应 该 大 
于 等 于 depsoffset) * / 
adjoffset= (depsoffset+ 7) & ~(0x07); 
if (adjoffset != depsOffset) { 
IOGV(djusting deps start from %d to sd 
(int) depsoffset, (int) adjoffset); 
depsoffset= adjoffset; 
1seek (fa,depsOffset, SEEK SET); 
} 
/* 写 人 依赖 库 信息 * / 
证 writeDependencies (fd,modhen,crc) (=0) { 
IOW ("Failed writing dependencies"); 
goto bail; 


/# 写 人 其 他 优化 信息 ,包括 类 索引 信息 以 及 寄存 器 映射 关系 * / 
if (friteoptpata (fd,pClassIookup, prRegvapBui loer)) { 

IOGN ("Failed writing opt data") ; 

goto bail; 


/* 对 odex 文 件 的 头 部 内 容 进行 修正 * / 
DexOptHeader optHdr; 

memset (&optHdr, Oxff, sizeof (optHdr) ); 

Temcpy (ptHdr .magic, EX OPT MAGIC,4); 

Temcpy (optHdr .megic+ 4,TEX OPT MAGIC VERS,4); 
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optHdr.dexoffset= (u4) dexoffset:; 
cptHdr.dexIength= (u4) oexIength; 
optHdr.depsoffset= (u4) depsoffset; 
aptHdr.depsTengthr (u4) depsTength; 
optHdr.optoffset= (ud) optoffset; 
aptHdr.aqptrengthr (u4) optTength; 


retum result; 
四 


dvmContinueOptimization() 函数 首先 对 目标 文件 进行 格式 检验 ,并 调用 mmap() 函数 将 原 
Dex 文件 整体 映射 至 内 存 , 再 调用 rewriteDex() 函数 并 根据 全 局 变量 中 的 dexOptMode 与 
classVerifyMode 字段 所 规定 的 优化 要 求 来 重 写 映 射 文件 ,这 里 的 重 写 内 容 包括 字符 顺序 调整 、 
字 节 码 替 换 、. 字 节 码 验证 以 及 文件 结构 重新 对 齐 等 工作 。 当 rewriteDex() 函 数 正常 返回 后 ， 
dvmContinueOptimization( ) 函数 将 会 依次 调用 writeDependencies( ) 函数 建立 依赖 库 和 
writeOptData() 函数 写 和 人 辅助 数据 。 当 以 上 几 个 步骤 结束 后 ,Odex 文件 的 各 个 关键 内 容 都 已 
经 具备 ,程序 的 最 后 将 根据 现实 情况 写 和 人 Odex 文件 头 部 信息 并 保存 。 

上 面 两 个 函数 是 位 于 机 制 函数 调用 链 的 上 层 , 通 过 对 源码 的 展示 分 析 , 相 信 读 者 已 经 对 
机 制 的 关键 的 执行 流程 有 了 一 定 的 认识 。 由 于 篇 幅 所 限 , 再 加 上 优化 机 制 源码 量 较 为 巨大 ， 
本 书 在 此 就 不 再 对 源码 进行 更 加 深入 的 介绍 展示 了 ,希望 读者 能 够 结合 下 载 的 源码 对 文中 
出 现 的 各 个 关键 的 功能 点 函数 进行 学 习 , 将 会 非常 有 助 于 理解 机 制 中 一 些 关键 技术 点 的 具 
体 实现 细节 。 

点 所 ”对 于 一 个 Dex 文件 来 说 ,如 果 在 cache 中 存在 一 个 与 之 对 应 的 Odex 文件 ,虚拟 
机 在 接收 到 运行 指令 时 ,会 直接 引用 执行 相对 应 的 Odex 文件 ,这 样 就 避免 了 二 次 验证 与 优 
化 ,减少 了 程序 启动 时 间 。 


1.4 Dex 文件 的 解析 


Dalvik 虚拟 机 与 标准 Java 虚拟 机 最 为 直观 的 不 同 在 于 其 输入 文件 格式 ,Dalvik 虚拟 机 
采用 由 多 个 Class 文件 整合 而 成 的 Dex 文件 ,其 结构 设计 与 意义 已 在 第 1 卷 第 3 章 中 进行 
了 介绍 ,此 处 不 再 闭 述 。 由 于 多 个 类 被 整合 到 一 个 Dex 文件 中 , 且 在 Dex 文件 中 类 与 类 之 
间 不 但 没有 明确 的 界限 ,甚至 还 有 共享 数据 的 情况 ,因此 ,这 就 要 求 类 加 载 机 制 在 实际 加 载 
一 个 目标 类 之 前 要 对 Dex 文件 进行 一 系列 预 处 理 , 使 Dex 文件 对 于 虚拟 机 来 说 是 可 读 的 。 
简单 来 说 ,Dex 文件 解析 的 主要 目的 是 对 Dex 文件 进行 读 取 分 析 并 通过 建立 一 个 DexFile 
结构 体 的 实例 对 象 专门 用 于 描述 该 Dex 文件 ,使 实际 的 类 加 载 函 数 可 以 通过 该 数据 结构 对 
目标 类 全 部 的 数据 进行 索引 并 提取 以 完成 类 的 实际 加 载 工 作 。 


1.4.1 DexFile 数据 结构 简 析 


为 目标 Dex 文件 生成 一 个 DexFile 数据 结构 实例 对 象 是 Dex 文件 解析 工作 的 重要 目 
标 ,在 第 1 卷 第 3 章 中 ,已 经 对 Dex 文件 的 结构 进行 了 详细 的 介绍 ,想必 读者 读 到 此 处 时 仍 
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还 能 回忆 起 些许 内 容 。 下 面 在 介绍 解析 工作 的 原理 和 实现 之 前 , 先 将 对 DexFile 数据 结构 
进行 一 个 简要 的 介绍 ,如 果 读 者 对 该 结构 体 中 各 个 成 员 变量 以 及 其 数据 结构 感到 陌生 ,建议 
重新 回顾 一 下 第 1 卷 第 3 章 的 内 容 。 

DexFile 结构 体 的 定义 如 表 1.4 所 示 , 从 中 可 以 发 现 该 数据 结构 的 成 员 变量 所 代表 的 内 
容 以 及 其 排列 顺序 与 经 过 优化 的 Dex 文件 的 结构 非常 相似 ,Dex 文件 中 的 各 个 数据 部 分 似 
乎 都 可 以 和 DexFile 结构 体 中 的 各 个 成 员 变 量 形成 相对 应 关系 。 


表 1.4 struct DexFile 结构 体 成 员 变 量 


成 员 变 量 类 型 变量 名 意 多 
const DexOptHeader” pOptHeader 优化 数据 头 部 
const DexHeader pHeader Dex 文件 头 部 
const DexStringId” pStringlds 指向 字符 串 索 引 区 
const DexTypeld* pTypelds 指向 类 型 索引 区 
const DexFieldId* pFieldlds 指向 字段 索引 区 
const DexMethodId pMethodlds 指向 方法 索引 区 
const DexProtold” pProtolds 指向 原型 索引 区 
const DexClassDef pClassDefs 指向 类 定义 区 
const DexLink” pLinkData 指向 连接 数据 区 
const DexClassLookup” pClassLookup 指向 类 索引 
const ul baseAddr 基地 址 


写 到 这 里 读者 就 应 该 知道 ,虚拟 机 正 是 通过 将 目标 Dex 文件 与 一 个 DexFile 数据 结构 
进行 关联 ,使 得 在 虚拟 机 内 部 ,负责 类 的 实际 加 载 的 功能 函数 可 以 通过 该 数据 结构 实现 对 
Dex 文件 中 各 类 数据 的 查找 获取 工作 。 也 正 是 利用 这 种 方式 ,虚拟 机 实现 了 对 一 个 存储 在 
内 存 中 不 可 读 的 数据 块 一 一 Dex 文件 进行 解析 的 目的 。 


1.4.2 Dex 文件 解析 流程 概述 


当 虚 拟 机 获得 了 程序 中 的 Classes. dex 文件 后 ,将 首先 对 这 个 Dex 文件 进行 初步 的 验 
证 工作 ,主要 包括 : 验证 Magic 数 , 校 验 SHA-1 签名 .计算 Dex 校 验 和 等 几 个 方面 ,其 目的 
主要 是 检验 该 Dex 文件 是 否 符合 Android 系统 规范 。 当 校 验 的 工作 完毕 后 ,将 对 Dex 文件 
进行 优化 和 验证 并 输出 优化 的 产物 一 一 Odex 文件 ,Dex 优化 与 验证 在 1. 3 节 已 经 进行 了 详 
细 的 分 析 和 介绍 。 在 接 下 来 的 工作 中 ,Odex 文件 将 取代 原 Dex 文件 被 加 载 机 制 进行 解析 。 

当 优 化 的 工作 结束 后 ,虚拟 机 将 会 开始 对 优化 过 的 Dex 文件 进行 解析 ,首先 需要 对 优 
化 后 的 Odex 文件 进行 完整 性 检验 ,以 确保 该 Odex 文件 是 完整 并 且 合乎 Android 系统 规 
范 。 随 后 ,虚拟 机 将 对 目标 Odex 文件 中 的 优化 数据 进行 解析 ,其 主要 目的 是 将 在 对 Dex 文 
件 优化 期 间 生 成 的 优化 数据 ,例如 : 类 索引 信息 、 寄 存 器 映射 关系 等 ,提前 与 DexFile 数据 
结构 中 的 个 别 成 员 变量 进行 关联 。 完 成 对 优化 数据 的 处 理 之 后 ,虚拟 机 将 对 原 Dex 数据 进 
行 解析 ,其 做 法 仍然 是 将 DexFile 数据 结构 中 其 他 各 个 成 员 变量 与 Dex 文件 的 各 个 数据 部 
分 相关 联 , 使 虚拟 机 能 够 更 加 高 效 地 对 Dex 文件 中 的 类 数据 进行 查找 并 获取 ,其 关联 效果 
如 图 1.5 所 示 。 


Android Dalvik 虚拟 机 结构 及 机 制 剖 析 一 一 第 2 卷 Dalvik 虚拟 机 各 模块 机 制 分 析 


DexFile 结 构 Dex 文 件 结构 
DexFile [一 一 DexOptHeader 
we 二 | 
哈 希 表 _ pOptHeader 
DexClassLookup pHeader dataO 仔 DexHeader 
Size pStringlds ClassDefOff 
numEntries plypelds DexStringid 
pFieldIds DexTypeld 
Table 1 pMethodlds DexFieldId 
ola DexMethodId 
Table2 | DexProtold 
PClassDefs | 
ss classldx 
pLinkData 
[= accessFlags 
pClassLookup 广 -DexClassDef 
baesAddr 一 
classDataOff 
Data 一 


图 1.5 Dex 文件 与 DexFile 数据 结构 映射 关系 图 


当 解析 函数 正确 输出 DexFile 数据 结构 的 一 个 实例 对 象 之 后 ,虚拟 机 将 再 次 对 Dex 文 
件 进 行 校 验 并 计算 SHA-1 值 , 最 后 保存 相关 设 定 并 将 该 实例 对 象 返回 。 至 此 ,Dex 文件 的 
解析 工作 结束 ,其 大 致 的 工作 流程 如 图 1.6 所 示 。 


对 0Odex 文 件 进 | 。| 解析 Odex 文 件 | 。| 为 Dex 文 件 与 相关 数 | 。| 为 Dex 文 件 进行 校 保存 设置 并 
返回 


行 完整 性 校 验 | | 中 的 优化 数据 | | 据 结构 建立 映射 关系 验 并 计算 SHA-1 


1.6 Dex 文件 解析 工作 流程 示意 图 
在 1.4.3 节 中 ,将 从 源码 实现 的 角度 对 Dex 文件 解析 这 部 分 工作 进行 一 个 详细 的 分 
析 , 同 时 也 希望 读者 能 够 结合 这 部 分 源码 进行 学 习 , 以 加 深 对 这 部 分 内 容 的 理解 。 
点 拨 DexFile 结构 体 是 用 于 描述 内 存 中 的 Dex 文件 ,虚拟 机 可 以 通过 该 数据 结构 快 
速 访问 Dex 文件 中 各 部 分 的 数据 。 然 而 ,这 一 切 的 功能 实现 是 需要 建立 在 一 个 严格 的 格式 
体系 之 中 。 由 此 可 见 , 系 统 架 构 的 设计 工作 是 非常 重要 的 。 


1.4.3 函数 执行 流程 


Dex 文件 解析 的 工作 主要 由 位 于 虚拟 机 源码 目录 dalvik/vm/RawDexFile. cpp 中 的 
dvmRawDexFileOpen 函数 完成 ,在 这 部 分 工作 中 称 dvmRawDexFileOpen 函数 为 主 控 函 
数 ,因为 在 它 的 调控 下 ,各 个 功能 点 函数 共同 配合 完成 了 对 Dex 文件 进行 解析 的 工作 。 
dvmRawDexFileOpen 函数 源码 如 下 。 

代码 清单 1.3 dalvik\vm\RawDexFile. cpp:dvmRawDexFileOpen() 函 数 源 代码 


int dwrRawDexFileopen (const char* 五 ]eName,const char* OdexoutputName, 
RawDexFile * * ppRawDexFile,bool isBootstrap) 


/* 声明 函数 中 间 的 执行 变量 * / 
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DnDex* ppyrDex=NULL; // 用 于 在 虚拟 机 中 描述 解析 的 Dex 文 件 
charx cachedName=NULL; // 用 于 保存 执行 期 间 产生 的 优化 Dex 文 件 名 
int result=-— 1; // 设 置 函 数 返 回 值 ,0 表示 成 功 

int dexFd 17 // 初 始 化 目标 Dax 文件 的 文件 描述 符 

int optFd= — 1; // 初 始 化 优化 pez 文件 的 文件 描述 符 
uamodrime= 0; // 初 始 化 文件 修改 时 间 参 数 

ua aqler32- 0; // 初 始 化 校 验 和 变量 

size t filesize= 0; // 标 示 文 件 大 小 

bool newEile= false; // 标 示 虚 拟 机 是 否 需要 对 Dex 文 件 进 行 优化 
bool lockedF false; // 用 于 标示 优化 进程 占用 


/* 全 leName 是 dmRawDexFileopen 函数 最 关键 的 入 口 参 数 , 它 是 一 个 字符 串 , 记 录 了 目标 

Dex 文 件 在 文件 系统 中 的 绝对 路 径 , 主 函数 通过 open 函数 根据 fileName 参数 将 目标 文件 进行 读 
人 至 虚拟 机 中 * / 

GexFd= open (fileName,O RDONLY); 

if (dexFdk 0) goto bail; 


GmSetCloseOnExec (GexFad) ; 
/* 对 Dex 文 件 的 合法 性 与 正确 性 进行 检验 * / 
if (verifyMagicAandGetadler3? (dexFd,saqler32)<0) { 

IOGE ("Error with header for %s", fileName); 

goto bail; 
" 
/* 记录 文件 修改 时 间 并 赋值 给 modTime 参 数 * / 
if (getMpdrimendsize (dexFd, grodrime, gfilesize)< 0) { 

IOGE ("Error with stat for %s", fileName); 

goto bail; 
} 

/根据 目标 Dex 文 件 名 为 其 产生 相应 的 优化 文件 名 并 赋值 给 cachedName* / 

if (0dexoutputName==NULL) { 

CachedName= dexOptGenerateCaheF i leName (fi leName, NULD) ; 

if (cachedName== NULL) 

goto bail; 

}else { 

CachedName= strdup (OdexOutputName) ; 
和 
LO ("durRawDexFi leQpen: Checking cache for ss (%5)", 

fileName, cahedName); 

/* 尝试 根据 cachedName 所 指 的 优化 文件 名 在 cache 中 查找 并 读 取 优化 文件 ,如 果 读 取 失 败 或 
是 当前 的 优化 文件 有 误 , 则 将 要 重新 对 Dex 文 件 进行 优化 * / 
optFd dumopenCachedDexFile (fi leName, cachedName, modTime, 

adler32, ispootstrap, newFile, /* createIfMissing= * /true); 
if (cptFck 0) { 

IOGI ("Unable to apen or create cache for %s (%s)", 

fi leName, cachedName); 
goto bail; 
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} 
locked= true;/* 在 前 面 提 到 ,如 果 odex 文 件 打开 失败 , 则 虚拟 机 将 把 newFile 参 数 置 为 真 。 在 此 处 
虚拟 机 将 根据 newEile 的 值 以 决定 是 否 需要 对 Dex 文件 进行 优化 x / 
if (newFile) { 
u8 startWhen, copyWhen, endWhen; 
bool result; 
off t dexoffset; 
cexOffset= lseek (optFd, 0, SFEK CUR); 
result= (dexoffset > 0); 
if (result) { 
StartWherFr dvmGetRelativeTimeUsec (); 
/* 将 cexFd 所 指 文件 复制 至 optFa 所 指 文件 中 * / 
result= copyFi leToFi le (optFd, dexFd, filesize)==0; 
copyWihere dnGetRelativeTimeUsec (); 
} 
/* 调用 dOptimizeDexFile 函数 对 optFd 所 指 文件 进行 优化 * / 
if (result) { 
result= dOptimi zeDexFi le (optFd, dexOffset, filesize, 
fileName, modTime, adler32, isBootstrap); 


4 
/* 当 Dex 文 件 的 优化 结束 后 ,将 会 调用 dumDexFileopenFrorEd 本数 对 该 Dax 文件 进行 解析 * / 
if (drDexFileQpenFrarEd (aptFd, SpDwrDex) (=0) { 
IOGI ("Unable to map cached ss fileName); 
goto bail; 
} 


IOGV("Successfully opened '%s'", fileName); 


/* 对 人 口 参 数 pgpRawDexzFile 进行 设置 ,ppRawDexFile 变量 是 一 个 RawDexFilex 类 型 的 指针 ,其 作用 
是 用 于 保存 当前 处 理 的 Dex 文 件 的 相关 信息 * / 

* PERawDexFile= (RawDexFilex ) calloc(],sizeof (RawDexFile)); 

/x 保存 优化 文件 名 x / 

(* PERawDexFile)- > cacheFileName= cahedName; 

/* 保存 DmDex 数 据 结 构 * / 


cachedName= NULL; // 释 放 cachedName 变量 
result= 0; // 设 置 返 回 值 ,0 表 示 成 功 
retum result. 


Ls 


dvmRawDexFileOpen 函数 首先 通过 调用 verifyMagicAndGetAdler32 函数 完成 对 Dex 文件 
的 magic 字段 以 及 校 验 信息 的 验证 工作 ,如 果 该 函数 正确 返回 ,证 明 该 Dex 文件 为 一 个 合 
文件 。 

点 所 魔 数 (magic) 是 为 了 方便 虚拟 机 识别 目标 文件 是 否 为 合格 的 Dex 文件 ,在 Dex 
文件 中 ,magic 为 dex/n035/0; 而 在 标准 的 Java Class 文件 中 ,其 magic 为 CAFEBABE。 
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随后 主 函 数 通过 调用 dexOptGenerateCacheFileName 函数 生成 该 Dex 文件 的 优化 文 
件 名 , 紧 接 着 调用 dvmOpenCachedDexFile 函数 ,根据 这 个 Dex 文件 的 优化 文件 名 在 dalvik 
_cache 中 查找 是 否 存 在 该 Dex 文件 的 优化 文件 (虚拟 机 在 第 一 次 执行 一 个 Dex 文件 时 会 对 
这 个 Dex 文件 进行 优化 并 生成 Odex 文件 , 置 放 于 cache 中 , 当 再 次 运行 该 Dex 文件 时 ,将 
跳 过 优化 的 步骤 ,直接 找到 Odex 文件 并 运行 之 ) ,如 果 不 存在 , 主 函 数 在 设置 相关 的 优化 参 
数 后 ,将 调用 dvmOptimizeDexFile 函数 完成 对 Dex 文件 的 优化 工作 并 在 cache 中 生成 
Odex 文件 。 至此, 主 函数 完成 了 对 Dex 文件 的 检验 与 优化 工作 。 这 部 分 的 工作 重点 是 对 
优化 的 Dex 文件 进行 解析 ,那么 该 解析 工作 是 由 哪个 函数 具体 承担 呢 ? 

dvmRawDexFileOpen 函数 在 完成 对 目标 Dex 文件 的 优化 后 ,将 会 调用 dvmDex- 
FileOpenFromFd 函数 完成 Dex 文件 的 后 续 解 析 工 作 , 其 源码 如 下 。 

代码 清单 1.4 dalvik\vm\DvmDex. cpp:dvmDexFileOpenFromFd() 函 数 源 代码 


int dumDexFileOpenFranFd (int fd, DDex” ppDmDex) 
| 
/* 声明 孔 数 执行 过 程 中 所 用 到 的 中 间 变 量 * / 
DDex * pDyDex; 
DexFile* pDexFile; 
MEnrMapping menMap; 
int parseFlags= kDexParseDefault; 
int result=-— 1; 
/* 验证 Dex 文 件 校 验 和 * / 
if (gpm.verifyDexChecksum) 
parseFlags |= kDexParseVerifyChecksum; 
证 (Lseek(fd,0,SEEK SET)<0) { 
IOGE ("lseek rewind failed"); 
goto bail; 
/* 对 目标 Dex 文 件 进行 映射 ,并 将 其 设置 为 只 读 文件 x* / 
if (sysMepFileInshmenWritableReadonly (fd, gnenMep) (=0) { 
IOGE ("Unable to map file"); 
goto bail; 
} 
/* 这 一 步 是 Dex 文 件 解析 工作 的 关键 ,dvmDexFileqpenFrcnEd 函数 通过 调用 dexFileParse 隐 数 对 
Dex 文 件 进行 解析 ,并 返回 一 个 DexEile 数 据 结构 的 实例 对 象 * / 
PDexFi le= GexFileParse ( (ul * )merMap.addr,merMap.length, 
ParseFlags); 
if (pDexFile==NULL) { 
IOGE ("TEX parse failed"); 
sysReleaseShmem (SmerMap) 7 
goto bail; 
} 
/* 主 函数 将 通过 allocatemrxStructures 函数 并 根据 ppexFile 变 量 作 为 参数 ,对 Dmpex 数 据 结 构 的 
一 些 成 员 变量 进行 了 设置 * / 
PPDwrDex= al locateAxStructures (pDexFi le); 
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} 


if (ppmDes==NULL) { 
GexFi leFree (pDexFi le); 
SysReleaseShmem (gmenMap); 
goto bail; 


result= 0; // 设 置 返回 值 ,0 表示 成 功 


从 上 面 的 源码 中 可 以 知道 ,dvmDexFileOpenFromFd 函数 首先 对 已 经 经 过 优化 的 Dex 文 
件 进行 相关 的 正确 性 检验 后 ,随即 将 调用 dexFileParse 函数 将 目标 Dex 文件 进行 解析 ,其 
目标 就 是 将 该 Dex 文件 与 一 个 DexFile 结构 体 对 象 建立 关联 ,那么 dexFileParse 函数 究 竞 
是 如 何 建 立 该 联系 的 呢 ? 首先 观察 一 下 dexFileParse 函数 的 源码 。 

代码 清单 1.5 dalvik\libdex\DexFile. cpp:dexFileParse() 函数 源 代码 


DexFile* dexFileFarse (const ul* data,size t length,int flags) 


{ 


/* 声明 一 个 DexFile 数 据 结构 的 指针 变量 ppexFile 用 于 保存 解析 结果 * / 
DexFile* pDexFile=NULL; 


const DexHeader * pHeader; // 用 于 保存 Dex 文 件 的 头 部 信息 
const ul* magic; // 用 于 保存 Dax 文件 的 魔 数 信息 
int result= 一 17 // 初 始 化 返回 值 


/* 对 Dex 文 件 大 小 进行 判断 ,如 果 其 文件 长 度 小 于 其 文件 头 的 长 度 , 则 该 px 文件 必然 是 错误 
的 * / 
if (length« sizeof (DexHeader)) { 
IOGE ("too short to be a valid .dex"); 
goto bail; // 否 则 为 错误 的 格式 
} 
/* 通过 malloc 函数 为 ppexFile 指 针 变 量 申请 相应 的 DexFile 数 据 结构 内 存 空间 * / 
PDexFile= (DexFile* ) malloc (sizeof (DexFile)); 
if (pDexFile== NULL) 
goto bail; /* alloc failure */ 
memset (pDexFile, 0, sizeof (DexFile)); 
/* 在 对 目标 Dex 文 件 进行 解析 之 前 ,目标 文件 进行 验证 ,可 以 看 到 主 函 数 通 过 调用 memcmp 函数 对 
Dex 文 件 的 magic 魔 数 进行 验证 ,以 明确 其 确 为 一 个 优化 的 Dex 文 件 * / 
if (memarp (data, EX OPT MPGIC, 4)==0) { 
magic= data; 
if (memamp tagict 4,DEX OPT MAGIC VERS,4) (=0) { 
IOGE ("bad opt version (0x%02x $02x $02x $02x)", 
magic[4] ,magic[5] ,magic[6] ,magic[7]); 
goto bail; 
} 
/* 将 优化 文件 头 部 与 DexFile 数 据 结 构 下 的 poptHeacer 变量 进行 关联 * / 
PDexFile-— > poptHeader= (const DexOptHeader* ) data; 
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IOW ("Good opt header, [EX offset js %d, flags= 0Qx%02x", 
PDexFile- > poptHeader— > dexOffset,pDexFile > poptHeader 
->flags); 
/* 通过 调用 dexParseoptpata 函数 对 优化 数据 进行 处 理 ,其 作用 也 是 将 各 个 优化 数据 与 
DexFile 数 据 结构 中 的 相应 成 员 变 量 进 行 关联 * / 
证 (!dexParseoptData (data, length,pDexFile) ) 
goto bail; 
/* 这 里 可 以 看 到 , 主 函数 通过 使 用 Data 变量 记录 当前 文件 所 分 析 到 的 位 置 ,用 length 记录 还 有 多 少 
内 容 尚未 分 析 * / 
datar=PDexFile >POptHeader_ > dexOffset; 
length -=PDaxFile- > POptHeaqder- > dexOffset; 
if (pDexFile- >POptHeader- > dexLength > length) { 
IOGE ("File truncated? stored lenF= %d, rem len= $d", 
EDexFile- > poptHeader- > dexTength, (int) length); 
goto bail; 
} 
length= pDexFile > poptHeader— > dexTength; 
} 
/* 通过 调用 dexFilesetupBasicFointers 陆 数 从 data 所 标示 的 位 置 继续 对 Dex 文 件 进行 
分 析 ,该 函数 的 主要 功能 是 将 Dex 文 件 中 其 他 各 部 分 数据 与 DexFile 数 据 结构 建立 完整 的 映射 关 
系 */ 
dexFilesetupBasicFointers (pDexFile, data) ; 
pHeader= pDexFi le- > pHeader; 
if (!GexHasValicdMagic (pHeader)) { 
goto bail; } 
/* 验证 Dax 文件 校 验 和 * / 
if (flags & KDexParseVerifyChecksum) { 
u4 adler= dexCanputehecksum (pHeager) ; 


IOW ("+ ++adler32 cpt checksum (%08x) verified",adler); 
和 
} 
} 
/x 验证 SBA-1 值 */ 
if (kVerifySignature) { 
unsigned char shalDigest [KSHAlDigestIen]; 


IOGV("+++ shal digest verified"); 
} 
} 
/* 当 完 成 了 相关 的 正确 性 检验 后 ,设置 返回 标示 ,0 表示 正确 ,并 返回 ppexFile 变 量 */ 
result= 0; 
retum pDexFile; 
Li 


根据 源码 可 以 看 到 dexFileParse 函数 首先 会 调用 dexParseOptData 函数 完成 对 Odex 


文件 中 所 包含 的 优化 数据 进行 分 析 , 主 要 是 将 DexClassLookup 喻 希 表 以 及 RegisterMaps 
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寄存 器 映射 关系 分 别 与 DexFile 数据 结构 下 的 pClassLookup 以 及 pRegisterMapPool 成 员 
变量 建立 关联 ,随后 将 调用 dexFileSetupBasicPointers 函数 对 Odex 文件 中 的 原 Dex 文件 
进行 解析 ,其 主要 工作 是 将 Dex 文件 中 各 个 部 分 数据 与 DexFile 结构 体 部 分 成 员 变 量 建立 
指针 映射 ,例如 ,将 baseAddress 指向 Dex 文件 在 内 存 映 射 的 首 地 址 .pHeader 指向 Dex 文 
件 的 头 部 .pMethodIds 指向 方法 区 索引 以 及 pClassDefs 指向 Dex 文件 的 类 数据 区 等 。 最 
后 dexFileParse 函数 将 计算 校 验 和 以 及 验证 SHA-1 值 并 正确 返回 ,至 此 ,dexFileParse 函 
数 的 工作 结束 。 

点 拨 ” 哈 希 技术 是 一 种 典型 的 以 空间 换取 时 间 的 优化 技术 ,这 种 技术 可 以 极 大 地 提高 
数据 的 查找 效率 ,在 大 型 系统 中 有 着 较为 广泛 的 应 用 。 哈 希 查 找 的 基本 原理 是 通过 一 个 哈 
希 函 数 将 目标 数据 的 标识 符 转化 为 一 个 哈 希 值 ,在 哈 希 表 中 该 哈 希 值 即 对 应 着 该 目标 数据 。 
简单 来 说 , 当 要 查找 某 一 数据 时 ,只 需 通过 该 哈 希 函数 计算 出 目标 数据 的 哈 希 值 , 进 而 再 根 
据 该 哈 希 值 在 哈 希 表 中 直接 取出 该 数据 。 哈 希 技术 实际 上 是 将 常规 的 查找 模式 中 所 使 用 的 
一 一 比较 的 方法 转化 成 了 更 加 直接 快速 的 数学 计算 ,以 此 来 提高 查找 效率 。 即 便 如 此 , 哈 希 
技术 在 实现 的 过 程 中 往往 需要 更 多 的 内 存 空间 以 解决 哈 希 冲突 ,因此 ,在 使 用 哈 希 技术 对 系 
统 进行 优化 时 需要 考虑 当前 平台 的 硬件 资源 是 否 宽裕 ,否则 不 仅 不 会 带 来 速度 的 提升 ,反而 
会 影响 系统 的 基本 功能 的 正常 运行 。 

如 图 1.7 所 示 为 dexFileParse 函数 执行 流程 图 。 


获取 入 口 参数 
data, length,flags 


调用 dexComputeChecksum 
函数 对 Dex 文 件 进行 验证 


调用 dexParseOptData 函 数 对 验证 SHA-1 
Opt 数 据 进行 分 析 并 更 新 索引 表 
返回 一 个 Dex 文 件 内 存 映射 


调用 dexFileSetupBasicPointers 
函数 设 定 Dex 文 件 各 个 数据 部 
分 的 基本 指针 


指针 pDexFile 给 调用 函数 


1.7 ”dexFileParse 函数 执行 流程 图 


事实 上 , 随 着 dexFileParse 函数 执行 的 结束 ,Dex 文件 的 解析 工作 也 即将 告 一 段落 ,类 
加 载 机 制 接 下 来 的 工作 就 是 根据 虚拟 机 的 运行 需要 ,从 Dex 文件 中 加 载 指定 类 ,并 将 其 装 
入 虚拟 机 的 运行 时 环境 中 。 


1.5 运行 时 环境 数据 加 载 


本 节 将 对 类 的 实际 加 载 工 作 的 原理 与 流程 进行 介绍 ,这 部 分 的 主要 工作 目标 是 将 目标 
类 的 所 有 信息 从 已 经 解析 的 Dex 文件 中 提取 出 来 ,并 装 和 虚拟 机 的 运行 时 环境 以 供 解释 器 
解释 执行 ,这 是 Dalvik 虚拟 机 执行 流程 之 中 非常 关键 的 一 步 。 


1.5.1 ClassObject 数据 结构 简 析 

类 加 载 机 制 的 最 终 目标 就 是 为 目标 类 生成 一 个 ClassObject 数据 结构 的 实例 对 象 ,并 将 
其 存储 在 运行 时 环境 中 随时 被 执行 模块 引用 执行 。 那 么 ClassObject 数据 结构 究竟 包含 着 
哪些 成 员 变量 ,而 且 这 些 成 员 变 量 都 担当 着 怎样 的 职责 ,是 本 部 分 主要 介绍 的 内 容 。 首 先 观 


察 一 下 ClassObject 数据 结构 的 具体 定义 ,如 表 1.5 所 示 。 


struct ClassObject 结构 体 定义 


类 加 载 模块 的 原理 及 实现 


成 员 变量 类 型 变量 名 意 问 
const char” descriptor 类 描述 符 
u4 accessFlags 访问 标示 符 
u4 serial Number 系列 号 
DvmDex” pDvmDex 指向 所 属 Dex 文件 
ClassStatus status 类 状态 标示 
ClassOjbect”* verifyErrorClass 错误 处 理 
u4 initThreadId 初始 化 进程 ID 
ClassObject” elementClass 元 素 类 
int arrayDim 数组 维 数 
PrimitiveType primitiveType 原始 类 型 
ClassObject” super 指向 超 类 
Object classLoader 类 装载 器 
int interfaceCount 接口 数目 
ClassObject” interfaces 对 象 接口 
int directMethodCount 直接 方法 数 
Method directMethods 指向 直接 方法 区 
int virtualMethodCount 虚 方法 数 
Method virtualMethods 指向 虚 方法 区 
int iftableCount 接口 表 数 目 
JInterfaceEntry” iftable 指向 接口 表 
int ifviPoolCount 常量 池 数 量 
int”™ ifviPool 常量 池 指针 
int ifieldCount 实例 字段 数目 
int ifieldRefCount 引用 字段 数目 
InstField” ifields 实例 字段 指针 
u4 refOffsets 字段 区 偏 移 量 
Const char” sourceFile 源 文件 名 
int sfieldCount 静态 字段 数目 
StaticField sfields 静态 字段 指针 


从 表 1.5 中 可 以 发 现 ,ClassObject 数据 结构 的 成 员 变量 数量 较 多 ,基本 上 包含 目标 类 
在 运行 期 间 所 需要 用 到 的 全 部 资源 .由 于 篇 幅 所 限 , 本 书 在 此 有 针对 性 地 对 几 个 关键 的 成 员 
变量 进行 介绍 ,对 于 其 他 变量 ,有 兴趣 的 读者 可 以 结合 源码 进行 学 习 , 该 数据 结构 的 定义 位 
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于 Dalvik 虚拟 机 源码 路 径 下 vm/oo/Object.h 文件 中 。 
1. pDvmDex 变量 


该 成 员 变 量 是 一 个 DvmDex 类 型 指针 ,DvmDex 数据 结构 实际 上 也 是 用 于 表示 一 个 已 
被 虚拟 机 解析 的 Dex 文件 , 它 与 前 面 介绍 的 DexFile 数据 结构 有 何不 同 呢 ? 事实 上 ， 
DvmDex 数据 结构 只 是 在 DexFile 数据 结构 的 基础 上 又 为 目标 Dex 文件 增加 了 一 些 辅助 信 
息 ,提高 了 对 Dex 文件 解析 的 效果 。 

2. super 变量 

该 成 员 变 量 是 一 个 ClassObject 数据 结构 指针 ,其 指向 当前 类 的 超 类 的 ClassObject 实 
例 对 象 ,通过 该 对 象 可 以 访问 引用 到 其 超 类 的 相关 资源 。 

3. classLoader 变量 

该 变量 表示 了 当前 类 的 指定 加 载 器 ,一般 来 说 ,系统 默认 类 加 载 器 基本 上 可 以 满足 应 用 
程序 中 的 用 户 类 的 加 载 工作 ,所 以 该 变量 往往 指向 该 默认 类 加 载 器 。 事 实 上 ,类 加 载 器 也 是 
一 个 类 ,其 在 内 存 中 也 有 相对 应 的 类 对 象 实例 ,系统 的 默认 类 加 载 器 是 在 系统 启动 时 被 装载 
进 虚 拟 机 。 

4. directMethods 变量 

该 变量 是 一 个 Method 类 型 的 指针 ,作用 是 指向 该 类 的 直接 方法 区 ,在 1.6 节 会 对 该 数 
据 结构 进行 较为 详细 的 介绍 。 同 时 ,该 数据 结构 是 虚拟 机 执行 模块 一 一 解释 器 的 重要 输入 ， 
解释 器 通过 该 数据 结构 能 获取 和 欲 执行 方法 的 全 部 运行 资源 。 


5. virtualMethods 变量 

该 变量 的 功能 含义 与 directMethods 变量 非常 相似 , 故 不 再 著述 。 

6. ifviPool 变量 

该 变量 是 一 个 int 类 型 的 指针 ,其 作用 是 指向 位 于 Dex 文件 中 的 数据 常量 池 。 
7. ifields 变量 

该 变量 是 一 个 InstField 类 型 的 指针 ,其 作用 是 指向 类 的 实例 字段 资源 。 

8. sfields 变量 


该 变量 是 一 个 StaticField 类 型 的 指针 ,其 作用 是 指向 类 的 静态 字段 资源 。 

以 上 便 是 ClassObject 数据 结构 中 至 关 重 要 的 一 些 成 员 变量 ,事实 上 ,这 些 数据 结构 
的 定义 相对 抽象 ,如 果 读 者 想 要 较为 透彻 地 和 弄 懂 这 些 内 容 , 作 者 建议 读者 对 解释 器 的 实 
际 执行 进行 跟踪 ,观察 虚拟 机 是 如 何 通过 使 用 这 些 资源 以 实现 对 一 个 目标 程序 进行 解释 
执行 的 。 


第 1 章 类 加 载 模块 的 原理 及 实现 


1.5.2 类 加 载 整 体 流程 概述 


类 加 载 机 制 的 根本 任务 是 根据 程序 运行 需要 在 已 被 虚拟 机 解析 的 Dex 文件 中 查找 并 
加 载 指定 类 。 经 过 Dex 文件 解析 的 工作 后 ,Dex 文件 中 的 各 个 部 分 数据 对 于 虚拟 机 来 说 都 
是 可 见 可 获取 的 ,因此 在 本 阶段 中 的 工作 流程 大 致 为 : 虚拟 机 在 获得 一 个 加 载 类 的 指令 后 ， 
其 首先 确定 加 载 类 所 属 的 Dex 文件 ,随后 在 全 局 变量 中 查看 虚拟 机 是 否 已 经 完成 了 对 该 
Dex 文件 的 解析 ,如 果 已 完成 解析 , 则 返回 该 Dex 文件 所 对 应 的 DexFile 数据 结构 ,再 根据 
欲 加 载 类 的 描述 符 在 DexClassLookup 喻 希 表 中 查找 获取 目标 类 的 各 个 部 分 数据 地 址 , 当 
得 到 Dex 文件 中 相关 类 数据 的 存储 地 址 后 ,将 通过 调用 相关 的 加 载 函数 对 指定 的 各 个 类 信 
息 进行 解析 并 装载 ,使 之 以 ClassObject 类 型 的 数据 结构 存储 于 运行 时 环境 之 中 ,并 为 解释 
器 的 执行 提供 相应 类 方法 的 字 节 码 。 以 上 工作 流程 如 图 1. 8 所 示 。 


获取 描述 Dex 文 件 的 | 。| 根据 目标 类 属性 选择 | 。| 在 DexFile 数 据 结构 中 获取 目标 | 。| 将 类 数据 信息 传 
DexFile 结 构 体 对 象 相应 的 加 载 模式 类 数据 在 Dex 文 件 中 的 分 布 信息 给 实际 加 载 函 数 


图 1.8 类 的 实际 加 载 工 作 流 程 


类 加 载 机 制 最 终 会 输出 一 个 ClassObject 数据 结构 的 实例 对 象 ,该 数据 结构 的 关联 关系 
如 图 1.9 所 示 。 


DvmDex 结 构 
DvmDex “一 一 一 
pDexFile ClassObject 结 构 
pHeader ClassObject 
pStringlds descriptor 
pTlypelds pDvmDex 
pFieldlds super 
. classLoader 
DexFile 结 构 Dex 文 件 结构 
DexFile 和 | DexOptHeader | es | 
pOptHeader | directMethods 
pHeader | dataof | We es 
pStringlds ClassDefOff Oe 
field 
pTypelds DexStringid es 
pFieldIds DexTypeld 
pMethodIds DexFieldId ifviPool 
DexMethodId 
PProtolds DexProtold 
PClassDefs 
classIdx 
pLinkData 
accessFlags 
pClassLookup 
baesAddr 一 
classDataOff 
Data 一 一 一 


1.9 ”ClassObject 结构 体 结构 图 
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从 图 1.9 可 以 发 现 , 虚 拟 机 通过 ClassObject 数据 结构 可 以 获取 到 指定 类 的 全 部 运行 时 
数据 。 另 外 ,1.6 节 将 会 通过 一 个 虚拟 机 运行 实例 ,介绍 一 下 ClassObject 数据 结构 是 如 何 
被 解释 器 引用 并 执行 ,以 证 明 ClassObject 数据 结构 在 程序 的 执行 过 程 中 起 到 了 不 可 替代 的 
作用 。 


1.5.3 函数 执行 流程 


Dalvik 虚拟 机 在 本 阶段 的 执行 过 程 初期 ,通过 调用 类 加 载 机 制 的 本 地 方法 接口 函数 
Dalvik_dalvik_System_DexFile_defineClass 对 运行 时 所 需 的 类 进行 定义 ,因此 ,该 函数 为 这 
阶段 工作 中 的 主 控 函 数 ,这 阶段 中 的 各 个 功能 点 函数 在 主 函数 的 宏观 调控 下 紧密 配合 共同 
完成 了 对 类 的 实际 加 载 工 作 , 其 函数 定义 位 于 vm/native/dalvik_system_DexFile. cpp 文 
件 中 。 

主 函数 Dalvik_dalvik_system_DexFile_defineClass 在 执行 的 初期 会 对 入 口 参 数 进行 处 
理 , 比 较 关键 的 是 根据 指定 类 名 生成 该 类 的 描述 符 , 在 虚拟 机 中 ,此 描述 符 将 会 作为 该 类 的 
唯一 标识 , 主 函 数 首 先 调用 dvmGetRawDexFileDex 函数 获取 Dex 文件 在 虚拟 机 中 的 
DexFile 数据 结构 ,随后 调用 dvmDefineClass 函数 并 以 前 面 生成 的 类 描述 符 以 及 相应 的 
DexFile 结构 体 指针 为 入 口 参 数 完成 对 指定 类 的 加 载 工作 。 实 际 上 ,dvmDefineClass 函数 
只 是 调用 findClassNoInit 函数 完成 实际 的 加 载 工作 。 因 此 ,下 面 主 要 围绕 findClassNoInit 
函数 的 实现 过 程 进行 介绍 。findClassNolnit 函数 源码 如 下 。 

代码 清单 1.6 dalvik\vm\oo\class. cpp:findClassNolInit() 函 数 源 代码 


static Classobject * findclassNoInit (const har* descriptor,Coject* loager, 
DDex * PDwmDex) 
{ 
/* 声明 一 些 中 间 变 量 * / 
Thread* self= dnlIhreadself(); 
ClassCbject* clazz; // 变 量 clazz 为 类 加 载 的 最 终 表 现形 式 
bool profilerNotified false; 
/# 判断 目标 类 是 否 有 类 加 载 器 ,事实 上 ,对 于 系统 类 ,虚拟 机 将 从 默认 的 启动 路 径 实现 其 加 载 工 
作 ; 对 于 用 户 类 ,虚拟 机 一 般 情况 下 使 用 默认 的 类 加 载 器 实现 加 载 工 作 * / 
if (oader !=NULL) { 
IOGVV (" 啡 ### findclassNoInit (%s,%p,%p)",descriptor, loader, 
PDwmDex- > pDexFile); 
. 


/* 根据 目标 类 的 描述 符 gescriptor 在 系统 已 加 载 类 中 进行 查找 ,如果 已 对 其 加 载 , 则 返回 目标 类 
的 Classcbject 对 象 ;否则 ,将 对 目标 类 进行 加 载 * / 
clazz= dwrLookupClass (Gescriptor, loader, true) ; 
if (clazz==NULL) { 
const DexClassDef * pclassDef; 
GnMethodTraceClassPrepBegin (); 
profilerNotified true; 
/* 判断 是 否 存 在 Dapax 结 构 体 对 象 ,如 果 存 在 , 则 表示 目标 类 为 一 个 用 户 类 ,我 们 将 要 从 一 个 解析 的 Dax 
文件 中 进行 加 载 , 对 于 一 个 解析 过 的 Dez 文件 ,是 一 定 存在 一 个 DaDex 结 构 体 对 象 的 , 故 PpaDex 一 定 不 为 
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空 ; 若 为 空 则 表示 目标 类 是 一 个 系统 类 ,虚拟 机 将 调用 seardBootPathFo rclass 函数 从 启动 路 径 下 查找 并 
加 载 目标 类 * / 
if (cDmDex==NULL) { 


assert (loader== NUILL); /* shouldn't be here otherwise * / 
PDvrDex= searchBootPathForClass (descriptor, gpClassDef); 
} else { 


/* 在 这 里 ,可 以 看 到 主 函 数 调用 dexFindclass 并 以 DexFile 数 据 结构 的 实例 对 象 ppexFile 作 为 参数 ， 
查找 目标 类 的 类 定义 资源 ,并 将 结果 返回 给 pclassDef 变量 * / 
pClassDef= dexFindclass (pDmDex— > pDexFile, descriptor); 
} 


/* 当 获 得 了 加 载 目 标 类 所 需 的 各 项 资源 , 主 函 数 将 调用 loadclassFranDex 函数 对 目标 类 进行 加 载 * / 
Clazz= loadclassFramDex (pDvnDex, pClassDef, loader) ; 
if (dvmCheckExosption (self)) { 

if (clazz !=NULL) { 
CumEreeClassInnards (clazz); 
mReleaseTrackedAlloc ( (Object * ) clazz,NOLD) 7 

} 

goto bail; 

} 

/* 将 目前 使 用 的 类 锁 住 ,防止 其 他 进程 更 改 * / 

dumLockGbject (self, (Object * ) clazz); 

clazz- > initThreadId= self- > threadId; 

/* 增加 到 哈 希 表 中 * / 

assert (clazz- > classLoader= = loader) 

if (!dwmaaclassToHash(clazz)) { 
clazz- > initThreadId= 0; 
dmUDnlockcbject (self, (Cbject * ) clazz); 

/x* 将 中 间 变 量 clazz 释 放 * / 
dmEreeClassIrnards (clazz) 7 
dnReleaseTrackedAlloc ( (Cbject * ) clazz,NOLD); 

/* 从 已 加 载 类 的 系统 哈 希 表 中 重新 得 到 的 类 x* / 
Clazz= dmLookupClass (descriptor, loader, true); 
assert (clazz !=NULD); 
goto got_class; 

} 

GmReleaseTrackedAlloc ( (Cbject * ) clazz,NULD); 
/* 准备 开始 连接 类 * / 

if (!dvwiinkclass (clazz)) { 

assert (dmCheckExosption (self)); 

/* 记录 错误 并 且 将 类 清空 * / 
removeClassFrarHash (clazz); 
clazz- > status= CIASS FFROR; 
drEreeClassInnards (clazz) 7 
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clazz- > initThreadId= 0; 

dumobjectNotifyA11 (self, (Cbject * ) clazz); 

dmDnlockcbject (self, (Cbject * ) clazz); 
Clazz- > descriptor, get. prooess name()); 


/* 将 类 的 状态 增加 到 全 局 变量 中 去 * / 
gpm.nmmLoadedClassest +; 
gbpvm.numDeclaredMethods+ = 
clazz- > virtualMethodcount+ clazz- > directMethodCount; 
gpvm.numDeclaredrInstFields+ = clazz- > ifieldCont; 
gpvm.numDeclaredStaticFields+=clazz- > sfieldCount; 


/* 对 一 些 变量 进行 检查 * / 
assert (dvmIsClassLinked (clazz) ); 
assert (gym.classJavaLangClass !=NULD); 
assert (clazz- > clazz== gDm.classJavaLangClass); 
assert (dvmIsclassObject (clazz)); 
assert (clazz= = gym.classJavalangobject | | clazz- > super !=NULD); 
if (!dwmIsInterfaceClass (clazz)) { 
/IOGT ("class= ss vtableCount= %d,virtualMethe= $d", 
// clazz- >descriptor,clazz- >vtablecount， 
// clazz- >VirtualMethodcount)7 
assert (clazz- >vtableCount >=clazz- > virtualMethodcount)7 
} 
/* 错误 处 理 * / 
bail: 
if (profilerNotified) 
dmMethodTraceClassPrepEnad (); 
assert (clazz !=NULL | | dmCheckExosption (self)); 
retum clazz; 
} 


从 上 面 的 源码 可 以 看 到 ,findClassNoInit 函数 负责 对 一 个 指定 类 进行 实际 加 载 的 工作 ， 
在 其 执行 的 初期 ,会 先 调 用 dvmLookupClass 函数 根据 类 的 描述 符 在 全 局 变量 gDvm. 
loadedClasses( 该 全 局 变量 记录 了 当前 虚拟 机 加 载 过 的 所 有 类 ) 中 进行 查找 并 判断 目标 类 是 
和 否 已 被 加 载 过 ,如 果 已 经 加 载 ,那么 直接 引用 这 个 已 加 载 类 并 将 类 对 象 指针 返回 给 调用 函 
数 , 和 否则 将 对 其 进行 加 载 ,如 图 1. 10 所 示 。 

事实 上 ,被 加 载 的 类 实际 上 分 为 两 种 : 

(1) 系统 基本 类 ; 

(2) 用 户 类 。 

对 这 两 种 类 进行 加 载 时 的 主要 区 别 体现 在 Dex 文件 查找 方式 的 不 同 , 当 和 欲 加 载 的 类 为 
系统 基本 类 时 ,findClassNoInit 函数 通过 调用 searchBootPathForClass 函数 从 系统 启动 基 
本 路 径 中 查找 并 加 载 目标 类 ;在 查找 用 户 类 时 , 主 控 函 数 将 会 调用 dexFindClass 函数 根据 


得 到 


loader, pDvmDex 


入 口 参 数 descriptor, 


I 


调用 dvmThreadSelf 获 取 


当前 


加 载 类 代码 的 线程 


直接 使 用 | 


于 
F 


调用 dvmLookupClass 


函 


数 判断 本 类 是 否 
已 经 被 加 载 


从 Dex 文 件 中 
加 载 
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判断 能 否 找到 
Dex 文 件 


调用 dexFindClass 在 指定 
Dex 文 件 中 查找 相关 类 
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调 


searchBootPathForClass 


查找 Dex 文 件 


L 


调用 loadClassFromDex 
函数 实现 加 载 类 达到 可 


运行 状态 


I 


调用 dvmAddClassToHash 
实现 将 新 加 载 的 类 添加 到 
哈 希 表 中 方便 在 此 查找 


1 


调用 dvmReleaseTracked 
Alloc 释 放 函 数 实现 过 程 
中 分 配 类 占用 的 内 存 


类 的 描述 符 在 Odex 文件 的 类 索引 表 中 进行 查找 匹配 ,该 函数 的 返回 为 一 个 DexClassDef 


结束 


1.10 ”findClassNolInit 函数 执行 流程 图 


结构 体 对 象 , 该 结构 体 定义 如 表 1. 6 所 示 。 


表 1.6 DexClassDef 数据 结构 定义 


变量 类 型 变量 名 称 描 ” 述 
u4 classIdx 类 索引 
ud accessFlags 访问 标示 符 
ud superclassIdx 超 类 索引 
ud interfaceOff 接口 数据 偏 移 量 
u4 sourceFileldx 源 文件 索引 
u4 annotationIdx 元 数据 信息 索引 
ud classDataOff 类 数据 偏 移 量 
ud StaticValueOff 静态 数据 偏 移 量 


从 表 1.6 中 可 以 看 到 ,虚拟 机 通过 该 数据 结构 可 以 快速 定位 目标 类 各 个 部 分 数据 位 于 


nl 


Dex 文件 中 的 位 置 , 在 一 定 程度 上 为 后 续 加 载 函 数 提供 了 便利 。 当 dexFindClass 函数 正确 
返回 后 ,findClassNoInit 函数 将 调用 loadClassFormDex0 函数 完成 对 该 类 的 加 载 工作 。 
loadClassFormDex0 函数 的 返回 值 为 一 个 ClassObject 结构 体 对 象 , 这 表明 该 函数 将 对 目标 
类 进行 实际 加 载 。loadClassFormDex0 函数 的 源码 如 下 。 
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代码 清单 1.7 dalvik\vm\oo\class. cpp:loadClassFormDex0() 函 数 源 代码 


static Classobject* loagdclassFrarDex0 (DyrDex* pDvynDex, 
Const DexClassDef * pClassDef,const DexClassDataHeader* pHeager, 
const ul * FEncodedpData,Gbject* classLoader) 


/* 声明 相关 的 中 间 变 量 * / 
ClassCbject * newclass=NULL; 
‘Const DexFile* pDexFile; 
const har* descriptor; 
/* 获取 相应 的 类 信息 * / 
EDexFile= pDwDax- > ppexFile; 


// 目 标 类 的 类 实例 对 象 
// 用 于 储存 目标 Dax 文件 所 对 应 的 DexFile 数 据 结构 实例 对 象 
// 用 于 储存 目标 类 的 描述 符 


descriptor= dexGetClassDescriptor (pDexFile,pClassDef); 


/* 为 即将 生成 的 类 对 象 实例 申请 内 存 空间 * / 


assert (descriptor !=NOULD)7 
if (classLoader==NULL && 


Strarp (descriptor, "Ljava/lang/Class;")==0) { 
assert (gDvm.classJavaLangClass !=NULD); 


DewClass= gDvm.classJavaLangclass, 
}else { 


上 


/* 取得 对 象 实例 大 小 并 在 内 存 中 申请 相应 内 存 * / 
Size t size= classObjectSize (pHeader- > staticFieldsSize); 
newClass= (ClassCbject* ) dnMalloc (size,ALIOC NON MWING); 


站 
if (newclass==NULL) 
retum NULL7 
/* 对 新 的 类 对 象 实例 进行 初始 化 * 


* 


DM CBJECT INIT (newCclass, gm.classJavaLangClass); 


dvmsSetClassSerialNuriber (newClass); 
newClass- > descriptor= descriptor; 


assert (newClass- > descriptorAlloc== NULD); 
SET CIASS FTAG (newClass,PClassDef- > acoessF1ags)7 


/* 设 定 字段 对 象 * / 


dumsetFieldobject((Cbject * )newClass, OFFSETOF MMBER (ClassO 
bject, classLoader), (Object * )classLoader); 


/* 设 定 类 的 相关 指针 * / 
DewClass- > FDmDex= pDmDex; 
newclass- > primitiveType= FRIM NOT; 
newclass- > status= CLASS IDK7 


/< 将 这 个 类 的 父 类 的 索引 加 入 到 类 对 象 的 指针 区 域 * / 
assert (sizeof (u4)== sizeof (ClassCbject * )); /< 32-bit deck */ 
DewClass- > super= (ClassCbject * ) pclassDef— > superclassIdx; 


/* 设置 类 的 参考 指针 = / 
const DexTypeList * PInterfacesList7 
/* 得 到 接口 列表 * / 
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pInterfacesLi st dexGetInterfacesList (pDexFi le,pClassDef); 
if (pInterfacesList !=NULL) { 
/#* 得 到 接口 数目 * / 
newclass- > jnterfacecount= pInterfacesList- > size; 
/* 得 到 接口 * / 
DewClass- > interfaces= (ClassQbject * *) dumLinearAlloc (classLoa 
der,newClass- > interfaceCount * sizeof (ClassObject* )); 
Asx 逐 一 对 接口 进行 处 理 * / 
for (i=0; ji< newClass- > jnterfacecCount; i++) { 
const DexTypeItem* pType= dexGetTypeTtem(pInterfacesList,i7 
newClass- > interfaces[i]= (ClassCbject * ) (u4) BIYpe- > typeIdx; 
} 
dumLinearReadonly (classLoader, newClass- > interfaces)7 
} 
/* 对 字段 进行 加 载 ,首先 加 载 静 态 字段 * / 
if (pHeader- > staticFieldsSize !=0) { 
int count= (int) pHeader- > staticFieldsSize; 
u4 lastIndex= 0; 
DexField field; 
/* 取得 字段 数 * / 
newClass- > sfieldcount= oount; 
/* 逐一 加 载 字 段 * / 
for (i=0; i< count; 计 +) { 
GexReadclassDataField (gpEncodedData, sfielq,&lastIndex)7 
loadsFieldFrarDex (newClass, gfield, gnewClass-— > sfields[i]); 
+ 
} 
/* 加 载 实例 字段 * / 
if Header- > instanceFieldssize !=0) { 
int count= (int) pHeader- > instanoeFieldsSize; 
ud lastIndesx= 0; 
DexField field; 
/* 取得 字段 数 * / 
newClass- > ifieldcount= count; 
newClass- > ifields= (InstField* ) dvmLinearAlloc (classLoager, 
count * sizeof (InstField)); 
/* 逐一 加 载 字段 * / 
for (i=0; ji< count; i++) { 
dexReadclassDataField (SpEncodedData, field, &lastIngex) ; 
loagIFieldEramDex (newClass, &field, snewClass- > ifields[i]); 
} 
dmLinearReadonly (classLoagder, newClass— > ifields); 
. 


/* 对 类 方法 进行 加 载 * / 
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if (pHeader— > directMethodssize !=0) /判断 直接 方法 数 是 否 为 0 
{ 
int count= (int) pHeader- > directMethodsSize; 
ua lastIndex= 0; 
DexMethod method; 
/* 取得 方法 数目 * / 
mewClass- > directMethodcount= count7 
newClass- > directMethods= (Methodx ) dumiLinearAlloc(classIoader, 
count * Sizeof(Method))7 
/逐一 加 载 方法 * / 
for (i=0; ji< count; i++) { 
GexReadclassDataMethod (gpEncodedData, gmethod, &last Index) ; 
loadMethodFramDex (newClass, gmethod, &newClass- > directMethods [i]); 
if (classMappata !=NULD) { 
const Regi sterMap* pMap= dnRegisterMapGetNext (gclassMapData); 
if (dwrRegisterMapGetFormat (FMap) != kKRegMapFonmatNone) { 
newClass- > directMethods [i] .registerMap= FMap; 
assert (newClass- > directMethods [i] .registersSize+ 7)/8 
==newclass- > directMethods [i] .registerMap- > regwidth) 7 
} 


} 
dmLinearReadonly (classLoader, newClass- > directMethods); 
} 
/< 加 载 虚 方法 * / 
证 (pHeager- > virtualMethodssize !=0) // 判 断 虚 方法 数 是 否 为 0 


int count= (int) pHeader- > virtualMethodsSize; 
u4 lastIndex= 0; 
DexMethod method; 
Ax 取 得 方法 数目 * / 
newClass- > VirtualMethodcount= oount; 
newClass- > virtualMethods= Method* ) dmiLinearAlloc(classLoader, 
Count * sizeof Method)); 
Asx 逐 一 处 理 方法 * / 
for (这 0; ji< count;z i++) { 
GexReadclassDataMethod (gpEnoodedData, gmethod, &last Index); 
loadMethodFramDex (newClass, Smethod, snewClass— > virtualMethods [i]); 
if (classMapData !=NULL) { 
const Regi sterMap* FMap= dwrRegisterMapGetNext (&classMapData) 7 
if (kmRegisterMepGetFormat (FMap) 二 JRegMepFormatNone) { 
newClass - > virtualMethods [i]. registerMap= FMap; assert ((newClass - > virtualMethods [i]. 
TegistersSizer 7)/8= = newClass- > virtualMethods [i] .registerMap- >Tedmidth); 
} 
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} 
diLinearReadonly(classLoader,newClass- > virtualMethods) ; 

} 

/* 保存 源 文件 信息 * / 

newClass- > sourceFi le= dexGetSourceFile (pDexFi le,pClassDef); 
retum newClass; // 返 回 类 对 象 

} 

loadClassFormDex0 函数 作为 实际 加 载 工作 的 承担 者 ,实际 上 ,其 工作 人 逻辑 相对 简单 ， 
即 依次 完成 : 在 内 存 中 为 类 对 象 申请 存储 空间 ; @ 设 置 字段 信息 ; @ 为 超 类 建立 索引 ; 
由 加 载 类 接口 ; @ 加 载 类 字段 ; @ 加 载 类 方法 ,并 将 以 上 数据 封装 成 一 个 ClassObject 结构 
体 对 象 并 返回 。 

当 loadClassFormDex0 函数 正常 返回 后 ,findClassNoInit 函数 要 对 全 局 变量 gDvm. 
loadedClasses 哈 希 表 进 行 更 新 以 及 进行 类 的 连接 工作 。 至 此 ,类 加 载 机 制 的 全 部 工作 
结束 。 

如 图 1. 11 所 示 为 loadClassFormDex0 函数 执行 流程 图 。 


开始 
1 
取得 入 口 参数 pPDvmDex， 调用 loadSFieldFromDex 
pClassDef, pHeader, 函数 加 载 类 字段 


pEncodedData, classLoader 
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调用 dexGetIndexForClassDef 


创建 一 个 ClassObject 类 型 的 得 到 类 定义 区 的 索引 
对 象 newClass 并 将 它 赋 值 空 
调用 dexReadClassDataMethod 
调用 dexGetClassDescriptor 读 取 并 加 载 类 方法 
函数 生成 类 描述 符 


1 
| 调用 dexGetSourceFile 函 数 


调用 dvmMalloc 为 新 的 类 获取 Dex 文 件 的 源 文 件 
(newClass) 申 请 内 存 空间 
结束 


调用 dexGetInterfacesList 函 
数 为 Dex 文 件 设置 内 部 指针 


图 1.11 loadClassFormDex0 函数 执行 流程 图 


1.6 类 加 载 机 制 与 解释 器 交互 示例 


ClassObject 数据 结构 作为 程序 类 被 加 载 后 的 表现 形式 ,同时 它 还 是 解释 器 机 制 的 重要 
输入 ,有 必要 讨论 一 下 该 数据 结构 是 如 何 承 担 起 程序 正确 运行 的 重要 作用 ,本 文 在 此 通过 一 
个 程序 运行 实例 介绍 一 下 解释 器 是 如 何 通 过 使 用 ClassObject 对 象 中 的 资源 去 解释 执行 一 


段 程序 。 
对 于 一 个 程序 的 执行 , 当 虚 拟 机 完成 类 的 加 载 工 作 后 ,解释 器 会 对 已 装载 的 代码 进行 检 
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查 , 验 证 是 否 符合 虚拟 机 的 格式 规范 ,最 后 调用 dvmInterpret 函数 初始 化 解释 器 并 开始 解 
释 执行 字 节 码 ,dvmInterpret 函数 是 解释 器 的 入 口 函数, 接 下 来 宏观 观察 一 下 这 个 函数 : 
dvmlnterpret( Thread * self, const Method* method, JValue* pResult), 可 以 发 现 这 个 
函数 的 第 二 参数 是 一 个 Method 类 型 的 指针 ,然而 这 个 指针 正 是 ClassObject 的 一 个 成 员 变 
量 ,由 此 可 以 看 到 这 是 类 加 载 器 和 解释 器 的 一 个 关键 的 交汇 点 ,但 这 还 不 是 最 核心 的 内 容 ， 
先 观察 一 下 Method 类 型 结构 体 的 细节 ,如 表 1.7 所 示 。 


表 1.7 Method 数据 结构 定义 


数据 类 型 变量 名 变量 含义 
ClassObject” clazz 一 个 类 对 象 实例 
ud accessFlags 访问 标示 符 
u2 methodIndex 方法 索引 
u2 registersSize 使 用 寄存 器 数量 
u2 outsSize outs 单元 大 小 
u2 insSize ins 单元 大 小 
const char” name 方法 名 
DexProto prototype 原 类 型 
const char” shorty 短 格式 的 方法 描述 字符 串 
const u2” insns 实际 代码 ,Dex 文件 在 内 存 中 的 映射 的 方法 区 
int jniArgInfo jni 信 息 
DalvikBridgeFunc nativeFunc 本 地 方法 引用 
bool fastJni 标示 本 地 方法 是 否 需 要 一 个 JNIEnv* 或 者 jclass 
bool noRef 引用 标示 
bool shouldTrace 是 否 需 要 被 日 志 所 记录 
const RegisterMap” registerMap 寄存 器 映射 
bool inProfile 在 profiling 时 这 个 方法 是 否 被 调用 


表 1.7 中 的 第 一 个 参数 clazz, 它 实际 是 一 个 ClassObject 类 型 的 指针 , 它 指向 这 个 方法 
隶属 于 哪个 ClassObject 实例 ,然而 在 这 个 结构 体 中 最 关键 的 成 员 变 量 是 一 个 const u2* 类 
型 的 指针 变量 insns, 它 指向 了 Dex 文件 的 实际 可 运行 代码 区 ,这 个 变量 将 在 解释 器 入 口 函 
数 dvmInterpret 中 有 重要 体现 ,下 面 是 dvmInterpret 函数 的 一 段 关键 代码 。 


Ax 初始 化 解释 器 工作 环境 * / 
self- > interpSave.method= method; 
self— > interpSave.curFrame= (u4* ) self— > interpSave.crFrame; 
self- > jnterpSave.pc=method- > insns; 
从 上 述 代 码 中 可 以 看 到 ,这 个 执行 进程 self 首先 取得 了 将 要 执行 方法 的 method 指针 , 随 
后 在 第 三 行 代码 中 ,虚拟 机 将 method-~>insns 可 执行 代码 区 的 首 地 址 赋值 给 了 执行 进程 的 
pc 指针 self>interpSave. pc, 随 后 解释 器 的 pc 指针 将 会 逐一 读 入 指令 并 执行 相关 字 节 码 。 
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小 结 


本 章 主 要 以 类 加 载 机 制 的 设计 原理 以 及 具体 实现 为 研究 重点 ,对 类 加 载 机 制 整体 功能 
架构 设计 ,实现 原理 ,机制 执行 流程 以 及 机 制 内 部 函数 调用 关系 进行 了 细致 的 研究 ,并 结合 
一 个 虚拟 机 运行 实例 描述 了 类 加 载 机制 产 物 在 虚拟 机 运行 过 程 中 所 起 的 重要 作用 。 同 时 ， 
本 书 还 从 实现 原理 以 及 工作 流程 两 方面 对 Dex 文件 的 优化 机 制 进行 了 阐述 ,该 机 制作 为 
Dalvik 虚拟 机 与 标准 Java 虚拟 机 重要 的 区 别 体现 ,是 Dalvik 类 加 载 机 制 最 关键 的 功能 模块 
之 一 ,对 类 加 载 机 制 乃至 Dalvik 虚拟 机 整体 性 能 都 有 着 重要 意义 ,更 重要 的 是 为 后 续 在 低 
性 能 的 嵌入 式 平 台 上 研究 实现 高 性 能 Java 语言 虚拟 机 提供 了 重要 参考 。 
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本 章 主要 内 容 


扣 内 存 管理 机 制 中 涉及 的 关键 数据 结构 有 哪些 ? 
?内存 管理 机 制 中 涉及 的 关键 函数 有 哪些 ? 

名 内 存 分 配 的 算法 和 流程 是 怎样 的 ? 

8 当前 主要 的 垃圾 回收 算法 有 哪些 ? 

名 垃圾 回收 的 流程 是 怎样 的 ? 


为 了 保证 Android 系统 的 正常 运行 和 应 用 程序 的 稳定 性 ,Dalvik 虚拟 机 的 内 存 管 理 机 
制 在 整个 虚拟 机 系统 中 占有 非常 重要 的 位 置 。Dalvik 虚拟 机 采用 怎样 的 算法 和 流程 来 分 
配 内 存 空 间 ? 对 于 空闲 不 再 使 用 的 内 存 又 是 采用 怎样 的 算法 和 流程 来 回收 ? 本章 针对 以 上 
疑问 一 一 解答 ,从 源 代码 入 手 , 分 析 Dalvik 虚拟 机 内 存 管理 的 原理 和 实现 。 


2.1 内 存 管理 初探 


内 存 分 配 和 垃圾 回收 机 制 是 Dalvik 虚拟 机 整体 设计 实现 架构 中 的 一 个 关键 部 分 ,用 户 
并 不 显 式 地 进行 垃圾 回收 工作 ,所 以 ,为 了 保证 Dalvik 虚拟 机 的 正常 运行 以 及 Android 系 
统 的 快速 和 稳定 性 ,必须 存在 一 套 行 之 有 效 的 机 制 来 保证 内 存 分 配 和 垃圾 回收 工作 的 顺利 
进行 ,内 存 管 理 部 分 与 其 他 模块 之 间 的 关系 如 图 2. 1 所 示 。 


内 存 管理 


分 配 类 对 象 
生成 类 对 
并 模 记 | 碟 关 并 归 、 字 市 丽 及 析 
初始 化 
i 


Dalvik 虚 拟 机 


图 2.1 内 存 管理 部 分 与 其 他 模块 关系 


Dalvik 虚拟 机 内 存 分 配 的 底层 依赖 是 基于 Doug Lea 编写 的 dlmalloc 内 存 分 配器 ,在 
Heap 上 完成 ,按照 分 配 规则 ,每 分 配 一 个 内 存 区 域 经 过 数 次 尝试 ,如 果 第 一 次 内 存 分 配 失 
败 了 ,那么 进行 一 次 垃圾 收集 ,这 次 垃圾 收集 并 不 收集 软 引 用 对 象 ,收集 完成 之 后 ,再 次 尝试 
进行 内 存 分 配 ,如果 第 二 次 尝试 再 次 失败 ,就 增长 堆 的 大 小 ,并 进行 第 三 次 的 分 配 尝 试 ,因为 
堆 是 可 以 在 堆 生 长 限制 之 内 进行 生长 的 。 如 果 第 三 次 尝试 再 次 失败 ,启动 垃圾 收集 器 
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进行 垃圾 收集 ,此 次 收集 过 程 收 集 软 引用 对 象 , 收 集 过程 完成 之 后 进行 第 四 次 的 内 存 
分 配 尝试 ,如 果 分 配 成 功 则 返回 一 个 指向 内 存 区 域 的 指针 ,和 否则 ,如 果 失 败 返 回 空 指针 
并 且 抛 出 异常 ,虚拟 机 暂停 工作 。 在 整个 内 存 分 配 尝试 中 ,进行 了 两 次 垃圾 收集 ,第 一 
次 不 收集 SoftReference, 第 二 次 收集 SoftReference。 垃 圾 收集 的 目的 就 是 及 时 回收 那 
些 不 再 使 用 的 对 象 的 空间 ,保证 内 存 堆 中 有 足够 的 空间 可 以 分 配对 象 ,分 配 过 程 中 最 
多 经 过 4 次 尝试 。 

点 拨 详细 了 解 Doug Lea 编写 的 dlmalloc 内 存 分 配器 的 源 代码 ,可 以 访问 http:/ /fayaa. 
com/code/view/3719/。 

Dalvik 虚拟 机 在 垃圾 回收 时 使 用 Mark Sweep 算法 ,该 算法 一 般 分 为 Mark 阶段 和 
Sweep 阶段 。Mark 阶段 就 是 标记 出 活动 对 象 , 使 用 栈 来 保存 根 集合 ,然后 对 栈 中 的 每 一 个 
元 素 ,递归 追踪 所 有 可 访问 的 对 象 ,对 于 所 有 可 访问 的 对 象 , 在 markBits 位 图 中 将 该 对 象 的 
内 存 起 始 地 址 对 应 的 位 设 为 1。 这样 当 栈 为 空 时 ,markBits 位 图 就 是 所 有 可 访问 的 对 象 集 
合 。 垃 圾 收集 的 第 二 步 就 是 回收 内 存 , 在 Mark 阶段 通过 markBits 位 图 可 以 得 到 所 有 可 访 
问 的 对 象 集合 ,而 liveBits 位 图 表示 所 有 已 经 分 配 的 对 象 集合 。 因 此 通过 比较 这 两 个 位 图 ， 
liveBits 位 图 和 markBits 位 图 的 差异 就 是 所 有 可 回收 的 对 象 集合 。 内 存 管理 部 分 的 框图 如 
图 2.2 所 示 。 


EE 内 存 充足 
启动 内 存 分 配 - 分 配 内 存 


间 充 足 


册 


启动 垃圾 回收 上 一 一 让 标记 对 象 片 二 让 消除 对 象 
图 2.2 内存 管理 部 分 框图 


Dalvik 虚拟 机 的 内 存 分 配 和 回收 是 在 HeapSource 结构 体 上 进行 的 ,而 每 一 个 HeapSource 
结构 体 又 包含 多 个 Heap 结构 体 成 员 ,确切 地 说 ,内 存 管理 的 场所 是 Heap, 在 Heap 上 分 配 
内 存 空间 或 者 回收 不 再 使 用 的 内 存 空间 。HeapBitmap 结构 体 用 于 内 存 回收 ,保存 了 对 已 
分 配 内 存 空间 的 标记 ,垃圾 回收 时 将 没有 被 标记 的 内 存 回 收 。 本 章 下 文 将 详细 介绍 各 个 结 
构 体 及 其 成 员 变 量 。 

Dalvik 虚拟 机 的 内 存 管理 机 制 的 实现 涉及 许多 函数 ,本 章 选 取 一 些 在 实现 过 程 中 起 关 
键 作用 的 关键 函数 进行 分 析 。dvmAllocObject 函数 的 主要 功能 是 虚拟 机 为 对 象 分 配 内 存 
空间 ;dvmHeapMarkRootSet 函数 用 于 垃圾 回收 的 标记 过 程 ;dvmHeapScanMarkedObjects 
函数 主要 实现 给 定 根 标记 的 位 图 ,找到 并 且 标 记 所 有 可 触及 的 对 象 ;processMarkStack 函 
数 是 在 Dalvik 虚拟 机 垃圾 回收 的 标记 步骤 中 用 到 的 处 理 标记 栈 的 关键 函数 ;ptr2heap 函数 
返回 指定 对 象 的 堆 ; createMspace 函数 创建 一 个 不 是 锁定 状态 的 dlmalloc 内 存 空 间作 为 一 
个 堆 资 源 ;allocMarkStack 函数 是 分 配 内 存 空间 的 关键 函数 ;dvmHeapSourceAlloc 函数 是 
Dalvik 虚拟 机 内 存 分 配 部 分 负责 分 配 内 存 空 间 的 关键 函数 ,分 配 过 程 是 在 HeapSource 上 
的 底层 内 存 资 源 Heap 上 进行 的 。 
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2.2 ”内存 分 配 过 程 分 析 
2.2.1 关键 数据 结构 


1. HeapSource 结构 体 


HeapSource 结构 体 是 在 dalvik/vm/ HeapSource. cpp 中 定义 的 ,以 下 为 HeapSource 结 
构 体 的 实现 代码 和 各 个 成 员 变 量 的 含义 。 
代码 清单 2.1 dalvik/vm/ HeapSource. cpp: HeapSource 结构 体 源 代码 


struct HeapSouroe { 
size t targetUtilization; Ax 理 想 的 堆 利 用 率 * / 
size t startsize; Ax 初 始 堆 大 小 * / 
size t maximmSize; A* 堆 资源 作为 整体 允许 生长 的 最 大 大 小 * / 
size t growthLimit; As*# 推 可 以 生长 到 的 最 大 大 小 * / 
size t idealSize; A# 推 资源 作为 整体 的 理想 最 大 值 * / 
size t softLimit; A# 人 允许 从 活动 的 堆 中 分 配 的 最 大 字 节 数 * / 


Asx<heap[0] 通 常 是 活动 的 堆 , 新 的 对 象 应 该 从 这 里 分 配 空间 * / 
Heap heaps[HEAP SOURCE MRX HEAP COUNT]; 


size t mmHeaps; As# 当 前 堆 的 数量 * / 

bool sawZygote; As# 如 果 HeapSource 创 建 的 时 候 zygote 是 活动 的 , 则 为 真 * / 
char * heapBase; * 内 存 的 基地 址 * / 

size t heapLength; As# 内 存 字 节 长 度 * / 

HeapBitmap liveBits; As# 存 活 的 对 象 位 图 * / 

HeapBitmap markBits; xx 标记 位 图 * / 


xGC 后 台 程 序 的 状态 量 .* / 
bool hasccThread; 

pthread t gcThread; 

bool geThreadshut oon; 
pthread mutex t gcThreacdMutex; 
Pthread cond t gcThreadcond; 
bool geThreadrrinNeeded; 


2. Heap 结构 体 

Heap 结构 体 在 dalvik/vm/ HeapSource. cpp 中 定义 ,以 下 为 结构 体 的 实现 代码 和 各 个 
成 员 变量 的 含义 。 

代码 清单 2.2 dalvik/vm/ HeapSource. cpp: Heap 结构 体 源 代码 


struct Heap { 
mspace msp; Ax 内 存 分 配 的 源 内 存 空间 < / 
size t maximmSize; zx 堆 可 以 生长 到 的 最 大 大 小 */ 


size t bytesAllocated; x 从 内 存 空 间 中 给 对 象 分 配 的 内 存 大 小 * / 
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size t ooncurrentStartBytes; As* 并 发 垃圾 收集 开始 前 分 配 的 内 存 大 小 * / 
size t cbjectsallocated; x 当前 从 内 存 空间 中 分 配 的 对 象 数 量 * / 
char * base; Ax 堆 的 最 低地 址 * / 

har * limit; A* 推 的 最 高 地 址 * / 


了 


Dalvik 虚拟 机 维护 了 两 个 对 应 于 内 存 的 位 图 ,分 别 为 liveBits 和 markBits。liveBits 标 
记 着 所 有 已 经 分 配 内 存 空间 的 对 象 , 而 markBits 标记 着 根 节点 和 所 有 正在 使 用 的 对 象 。 这 
样 , 所 有 在 liveBits 中 标识 而 没 在 markBits 中 标识 的 位 对 应 的 对 象 就 是 垃圾 ,应 该 在 垃圾 回 
收 时 被 回收 释放 。 

点 拨 Heap 是 一 个 和 底层 关系 很 近 的 数据 结构 ,对 象 的 内 存 分 配 和 释放 直接 在 这 上 
面 进 行 。 


2.2.2 关键 函数 


1. dvmAllocObject 函数 


dvmAllocObject 函数 在 dalvik/vmyalloc/Alloc. cpp 文件 中 定义 , 源 代码 如 下 所 示 , 函 
数 流程 图 如 图 2. 3 所 示 。 
代码 清单 2.3 dalvik/vm/alloc/Alloc. cpp: dvmAllocObject() 源 代码 


Cbject * dwmAllocobject (Classobject * clazz,int flags) 
{ 
Cbject* newobj; /声明 新 的 对 象 
assert (clazz !=NULD)7 
assert (dmIsClassInitialized (clazz) || dwmIsClassInitializing (clazz)); 


newobj= (Cbject * )dnMalloc (clazz- > objectSize, flags); 
if (newobj {=NULL) { // 如 果 对 象 不 为 空 
INVM OBJECT_INIT (newobj ,clazz); 
dmTrackAllocation (clazz,clazz- > dbjectSize); 


开始 
retum newobj; // 返 回 分 配 的 对 象 
} 得 到 入 口 参数 clazz, flags 
首先 获得 入 口 参数 clazz 和 flags。 定 义 newObi 指 虚拟 机 分 配 内 存 


针 。 然 后 在 垃圾 回收 堆 上 进行 内 存 分 配 ,实现 newObj 一 
(Object * ) dvmMalloc (clazz—> objectSize， flags)。 淹 断 
newObj 是 否 为 null, 若 不 为 null, 则 执行 函数 ,进行 DVM 


判断 新 建 对 象 
是 否 为 空 


否 
对 象 初始 化 ,通知 调试 监控 服务 。 若 为 null, 则 直接 返回 。 [pve | 
newObj。 DVM 分 配 跟 踪 返 加 


2. createMspace 函数 


createMspace 在 dalvik/vm/alloc/ HeapSource. cpp 图 2.3 dvmAllocObject 函数 流程 图 
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中 定义 , 源 代码 如 下 所 示 ,函数 流程 图 如 图 2.4 所 示 。 


得 到 入 口 参数 base, 


startSize, maximumSize 


创建 虚拟 机 堆 初始 大 小 


通过 堆 的 基地 址 创建 连 
续 的 内 存 空间 , 赋 给 msp 


设置 内 存 空间 从 系统 
中 得 到 的 最 大 字 节 数 


发 出 失败 信息 , 无 
法 创建 堆 空间 大 小 


部 


2.4 ereateMspace 函数 流程 图 


代码 清单 2.4 dalvik/vm/alloc/HeapSource. cpp: createMspace() 源 代码 


static mspace CreateMspace (void * base,size t startSizesize t maximmSize) 
{ 


IOGV_HERP ("Creating WM heap of size %$zu", startSize); 
ermo=0; 


mspace msp= Create _contigucus mspace With base (startSize/2, 
maximmSize, /* locked= * /false,base); // 创 建 连续 的 内 存 区 域 
if sb (=NULL) { // 如 果 分 配 成 功 
mspace set max allowed footprint (msp, startSize); 
}else { 


IOGE FEAP ("Can't create WM heap of size (%zu,%zu): Ss", 
startSize/2,maximmSize, strerror (ermo))7 


retum msp; // 返 回 分 配 的 内 存 区 域 


， 
createMspace 函数 的 主要 功能 是 ,创建 一 个 不 是 锁定 状态 的 dimalloc 内 存 空 间作 为 一 


个 堆 , 开 始 保留 startSize/2 比特 但 是 允许 它 生 长 到 startSize。 首 先 得 到 入 口 参数 ,base 为 
创建 堆 的 基地 址 .startSize 为 创建 堆 的 初始 大 小 .maximumSize 为 创建 堆 的 最 大 大 小 。 然 
后 创建 虚拟 机 堆 初 始 大 小 。 通 过 堆 的 基地 址 创建 连续 的 空间 , 赋 给 msp。create_ 
contiguous_mspace_with_base 函数 有 startSize/2, maximumSize, false, base4 个 参数 。 接 
着 判断 msp 是 否 为 null, 若 为 null, 则 发 出 失败 信息 ,无 法 创建 堆 空 间 大 小 ,接着 结束 ; 若 不 
为 空 , 则 设置 内 存 空间 为 从 系统 得 到 的 最 大 字 节 数 ,返回 msp, 最 后 结束 。 


3. addNewHeap 函数 


addNewHeap 在 dalvik/vm/alloc/ HeapSource. cpp 中 定义 , 源 代 码 如 下 所 示 ,函数 流程 


图 如 图 2.5 所 示 。 


获取 入 口 参数 hs 


hs->numHeaps > 一 


HEAP_SOURCE_MAX_HEAP_COUNT 


是 否 成 立 ? 


否 


初始 化 新 申请 的 内 存 


堆 字符 与 页 大 小 对 齐 


定义 堆 数组 的 底部 为 overhead 


overhead + HEAP_MIN_FREE >= 
hs->maximumSize 是 否 成 立 ? 


对 堆 进行 初始 化 
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发 出 信息 “尝试 创建 


过 多 的 堆 "。 停 止 虚 
拟 机 ， 返 回 false 


发 出 信息 “没有 更 
多 的 空间 创建 堆 ”。 
返回 false 


false 


对 堆 内 存 空间 进行 初始 化 ， 设 置 内 
存 空间 为 从 系统 得 到 的 最 大 字 节 数 


块 拷贝 ， 把 新 堆放 在 列表 中 


返回 ture 


结束 


图 2.5 addNewHeap 函数 流程 图 
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代码 清单 2.5 dalvik/vm/alloc/HeapSource. cpp: addNewHeap() 源 代码 


static bool addNewHeap (HeapSource * hs) 
{ 
Heap heap; // 声 明 堆 


assert (hs != NOLL); 
证 hs->numHeaps >=HEAP SOURCE MAX HEAP COUNT) { // 如 果 堆 的 数量 过 大 
IOGE (Attempt to create too many heaps ($2d >=$%2zd)", 
hs- > nmHeaps, HEAP SOURCE MAX HEAP COUNT); 


dummbort (); 
retum false; // 返 回 错 误 
} 
memset (gheap, 0, sizeof (heap)); // 初 始 化 堆 空 间 


Void * sbrk0= contiguous mspace sbrk0 (hs- > heaps[0] .msp); 

char * base= (char * )RLIGN UP TO PAGE, SIZE (sbrk0); 

Size t overhead= base - hs- > heaps[0] .base; 

assert (( (size t)hs- >heaps[0] .base & (SYSTEM FAGE, SIZE -1))==0); 


if (overhead+r HEAP MIN FREE >=hs- >maximmSize) { 


IOGE HEAP ("No roam to create any more heaps " // 打 印 错误 信息 
"($2zd overhead, $zd max)", 
overhead, hs— > maximmSize); 
retum false; 
} 
heap.maximmSize= hs- > growthLimit - overhead; // 设 置 堆 的 各 个 成 员 变 量 
heap.concurrentStartBytes= HEAP MIN FREE - OONCURRENT START; 
heap.base= base; 


heap.msp= createMspace (base, HEAP MIN FRFE,hs- >maximrnSize - overhead); 
if (heap.msp==NOLL) { // 推 空间 为 空 ,返回 错误 
retum false; 


xx 不 允许 soon- to-be-old 堆 生长 x / 

hs- > heaps[0] .maxim mSize= overhead; // 设 置 成 员 变 量 
hs- > heaps[0] .limit=base; 

mspace msp= hs- > heaps [0] .msp; 

mspace set max allowed footprint (msp,mspace footprint (msp)); 

As* 把 新 堆放 在 列表 中 ,在 heaps[0]。 向 下 移动 已 经 存在 的 堆 * / 

menmove (shs- > heaps [1], shs— >heaps[0],hs- > mmHeaps * sizeof (hs- >heaps[0])); 
hs- > heaps{0]=heap; 

hs- >nmmHeaps+ +; 
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retum true; // 返 回 真 
} 


addNewHeap 函数 是 HeapSource. cpp 文件 中 的 关键 函数 ,其 主要 功能 是 添加 额外 的 
堆 到 堆 资 源 中 。 如 果 有 太 多 的 堆 或 者 没有 充足 的 空间 来 添加 其 他 的 堆 时 ,返回 false。 首 先 
获取 入口 参数 hs, 然 后 判断 hs>numHeaps 二 =HEAP_SOURCE_MAX_HEAP_COUNT 
是 否 成 立 “HEAP_SOURCE_MAX_HEAP_COUNT” 代 表 堆 的 最 大 数量 。 若 成 立 则 发 出 
信息 “尝试 创建 过 多 的 堆 ” ,停止 虚拟 机 ,返回 false 结束 ; 若 不 成 立 , 则 对 结构 体 和 数组 进行 
清 零 ,初始 化 新 申请 的 内 存 。 使 堆 字符 与 页 大 小 对 齐 ,定义 堆 数组 的 底部 为 overhead。 接 着 
判断 overhead 十 HEAP_MIN_FREE 二 =hs 一 maximumSize 是 否 成 立 , 若 成 立 则 发 出 信息 
“没有 更 多 的 空间 创建 堆 ” ,返回 false 结束 ; 若 不 成 立 , 则 对 堆 进 行 初始 化 ,接着 判断 heap. 
msp 王 =NULL 是 否 成 立 。 若 成 立 则 返回 false 结束 ; 若 不 成 立 , 则 对 堆 内 存 空间 进行 初始 
化 ,设置 内 存 空间 为 从 系统 得 到 的 最 大 字 节 数 。 然 后 进行 块 拷贝 ,把 新 堆放 在 列表 中 ,返回 
true, 结 束 。 


4. allocMarkStack 函数 


allocMarkStack 在 dalvik/vm/alloc/HeapSource. cpp 中 定义 , 源 代码 如 下 所 示 , 函 数 流 
程 图 如 图 2.6 所 示 。 


开始 


| 获得 入 口 参 数 stack, maximumSize 


为 函数 分 配 名 称 为 “Dalvk 标 记 栈 ” 


[ 设置 栈 的 长 度 为 最 大 的 堆 空间 


| Dalvik 虚 拟 机 分 配 区 域 空间 


[给 栈 底 ， 长 度 限制 ， 栈 项 赋值 


返回 ture 1 
返回 null 


2.6 allocMarkStack 函数 流程 图 


代码 清单 2.6 dalvik/vm/alloc/HeapSource. cpp: allocMarkStack() 源 代码 


Static bool allodMarkStack (GoMarkStack * stack,size t maximmSize) 
{ 
const char * name= "dalvik— mark— stack"; 
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Void * addr; 
assert (stack != NOLD); 
stack— > length= maximmSize * sizeof(Cbject* ) / 
(sizeof (bject)+ HEAP SOURCE CHONK OVERHEAD); 
addir= dunAllocRegion (stack- > length, PROT RFEAD | FROT WRITE, name); 


if addr==NOLD) { // 如 果 地 址 为 空 ,返回 假 
retum false; 
stack- >base= (const Gbject * *)addr; // 设 置 各 个 成 员 变量 


stack- > limit= (const Gbject **)((char * )addr+ stack- > length); 
stack- > top= NOLL; 
Imadvjse (stack- > base stack— > length,MADV_DONTNEFD) ; 
retum true; 
} 


allocMarkStack 函数 是 分 配 内 存 空 间 的 关键 函数 ,首先 获取 stack,maximumSize 两 个 人 口 
参数 ,然后 定义 一 个 常量 字符 指针 x name 一 "dalvik-mark-stack" 和 空 指 针 void * addr。 判 断 栈 
是 否 为 空 。 栈 不 为 空 时 ,设置 栈 长 度 为 对 象 最 大 分 配 空 间 大 小 stack 一 length 一 
maximumSize。addr 赋值 为 Dalvik 虚拟 机 分 配 区 域 地 址 ,其 参数 包括 (stack 一 length， 
PROT_READ | PROT_WRITE, name)。 然 后 对 addr 进行 判断 , 若 addr 王 于 NULL 成 立 
则 返回 false, 若 不 成 立 则 继续 执行 。 接 着 为 栈 定 义 stack 一 base 二 (const Object* * )addr， 
栈 底 为 对 象 地 址 ; stack 一 limit 王 (const Object* #* )((Ccharx )addr 十 stack-~length) , 栈 的 
长 度 限 制 为 对 象 地 址 十 栈 的 长 度 ;stack-~>top= 王 NULL, 栈 顶 为 空 。 最 后 返回 true。 


5. dvmHeapSourceAlloc 函数 


dvmHeapSourceAlloc 在 dalvik/vm/alloc/ HeapSource. cpp 中 定义 , 源 代 码 如 下 所 示 ， 
函数 流程 图 如 图 2.7 所 示 。 

代码 清单 2.7 dalvik/vm/alloc/HeapSource. cpp: dvmHeapSourceAlloc() 源 代码 

void* dmHeapSourceAlloc(size t n) 


{ 
HS _ BOTFRPIATE(); 


HeapSouroe * hs= gHs; /声明 堆 资 源 
Heap* heap=hs2heap (hs); 
if eap- >bytesAllocated+ n >hs- > softLimit) { // 如 果 超 过 限制 ,返回 空 


IOGV FEAP ("softLimit of szd.%03zdMB hit for $zd- byte allocation", 
ERACTICNAL MB hs- > SoftLimit),D)7 


Tetum NULL7 
1 
voidx ptr=mspace calloc (heap- >msp,1,n); // 分 配 空间 
if (ptr==NUIL) { // 分 配 结果 为 空 ,返回 空 


retum NOLD; 


countAllocation (heap,ptr); 
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if (gpm.gcHeap- > gcRumning || Ihs->hasGcThread) { 


} 


retum ptr; 


if (heap- >bytesAllocated > heap- > concurrentStartBytes) { 


. 


retum ptr; 


NULL 


dumsignalCond(&gHs- > gcThreadcong) ; 


获取 HeapSource 


获取 Heap 


分 配 n 字 节 的 空间 


更 新 分 配 数 量 


1 
唤醒 垃圾 收集 | 返回 分 配 成 功 指针 


2.7 dvmHeapSourceAlloc 函数 流程 


dvmHeapSourceAlloc 函数 是 Dalvik 虚拟 机 内 存 分 配 部 分 负责 分 配 内 存 空间 的 关键 函 
数 ,分配 过 程 是 在 HeapSource 上 的 底层 内 存 资源 Heap 上 进行 的 。 首 先 获取 虚拟 机 系统 的 
HeapSource 资源 和 Heap 资源 ,然后 判断 分 配 空 间 是 否 超 出 空间 的 限制 , 即 heap 一 
bytesAllocat ed 十 n 盖 hs 一 softLimit 的 真 值 是 否 为 真 . 如 果 为 真 ,证 明 当 前 空间 的 最 大 值 不 
足以 分 配 指定 大 小 的 空间 ,返回 NULL 指针 并 打印 信息 。 和 否则 如 果 为 假 , 则 继续 执行 分 配 
过 程 ,调用 底层 函数 mspace_calloc 在 Heap 的 内 存 区 域 上 分 配 一 个 n 字 节 大 小 的 空间 , 返 
回 一 个 指向 内 存 空间 的 指针 ,如 果 指 针 为 空 , 则 内 存 分 配 失败 ,返回 一 个 NULL 指针 , 若 不 


为 空 , 则 调 月 


日 countAllocation 函数 更 新 分 配 结果 ,将 分 配 的 空间 大 小 和 分 配 的 对 象 数量 进 


行 更 新 ,即将 bytesAllocated 和 objectsAllocated 数据 进行 更 新 。 然 后 判断 垃圾 回收 过 程 是 
否 正在 进行 , 即 gcRunning 是 否 为 真 , 如 果 为 真 , 则 说 明 垃 圾 回收 过 程 正 在 执行 ,返回 内 存 
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分 配 指针 ,分 配 过 程 成 功 完成 。 和 否则 为 假 , 则 继续 向 下 执行 。 判 断 bytesAllocated 是 否 大 于 
concurrentStartBytes, 即 已 经 分 配 的 比特 大 小 是 否 大 于 并 行 垃圾 回收 启动 的 内 存 使 用 量 ， 
如 果 是 , 则 说 明 分 配 n 比特 的 内 存 空间 之 后 内 存 空间 使 用 量 过 大 ,需要 唤醒 垃圾 收集 器 进行 
垃圾 回收 ,回收 完成 后 返回 指向 内 存 区 域 的 指针 。 若 没有 超过 , 则 直接 返回 。 

这 个 函数 应 用 于 Dalvik 虚拟 机 内 存 分 配 的 4 次 内 存 分 配 尝试 中 ,每 一 次 内 存 分 配 都 将 
调用 此 函数 ,此 函数 是 一 个 接触 底层 分 配 的 一 个 函数 ,操作 的 内 存 区域 都 是 实 实在 在 的 底层 
内 存 区 。 


2.2.3 ”内存 分 配 流程 


虚拟 机 内 存 分 配 的 底层 依赖 是 基于 Doug Lea 编写 的 dlmalloc 内 存 分 配器 ,在 Heap 上 
完成 。 内 存 分 配 过 程 伪 代 码 如 下 所 示 。 
代码 清单 2.8 内 存 分 配 过 程 伪 代 码 


Cbject * dvmAllocbject (ClassObject * clazz,int flags) { 
IF get cbject size fom class cbject clazz 


first try: allocate n bytes fran heap // 第 一 次 尝试 

if first try failed { // 如 果 第 一 次 尝试 失败 
rn garbage collector without collecting soft references // 第 一 次 垃圾 收集 
second try: allocate n bytes fran heap // 第 二 次 尝试 

} 

if second try failed { // 如 果 第 二 次 尝试 失败 
third try: grow the heap and allocate n bytes from heap /第 三 次 尝试 

} 

if third try failed { // 如 果 第 三 次 尝试 失败 
run garbage collector with collecting soft references // 第 二 次 垃圾 收集 

fourth try: grow the hap and allocate n bytes from heap // 第 四 次 尝试 

} 

if fourth try failed,rebam null pointer, dalvik mn will abort // 如 果 第 四 次 尝试 失败 


} 


可 以 看 出 ,为 了 分 配 内 存 ,虚拟 机 尽 了 最 大 的 努力 ,做 了 4 次 尝试 。 如 果 第 一 次 内 存 分 
配 失败 了 ,那么 进行 一 次 垃圾 收集 ,这 次 垃圾 收集 并 不 收集 软 引 用 对 象 ,收集 完成 之 后 ,再 次 
尝试 进行 内 存 分 配 ,如 果 第 二 次 尝试 再 次 失败 ,就 增长 堆 的 大 小 ,并 进行 第 三 次 的 分 配 尝试 ， 
因为 堆 是 可 以 在 堆 生 长 限制 之 内 进行 生长 的 。 如 果 第 三 次 尝试 再 次 失败 ,启动 垃圾 收集 器 
进行 垃圾 收集 ,此 次 收集 过 程 收集 软 引 用 对 象 ,收集 过 程 完成 之 后 进行 第 四 次 的 内 存 分 配 尝 
试 ,如 果 分 配 成 功 则 返回 一 个 指向 内 存 区 域 的 指针 ,否则 ,返回 空 指针 并 且 抛 出 异常 ,虚拟 机 
暂停 工作 。 在 整个 内 存 分 配 尝 试 中 ,进行 了 两 次 垃圾 收集 .第 一 次 不 收集 SoftReference, 第 
二 次 收集 SoftReference。 垃 圾 收集 的 目的 就 是 及 时 回收 那些 不 再 使 用 的 对 象 的 空间 ,保证 
内 存 堆 中 有 足够 的 空间 可 以 分 配对 象 。 

点 拨 ”SoftReference 是 默认 引用 实现 , 它 会 尽 可 能 长 时 间 地 存活 于 虚拟 机 内 , 当 没 有 
任何 对 象 指 向 它 时 GC 执行 后 将 会 被 回收 ;WeakReference, 顾 名 思 义 ,是 一 个 弱 引 用 , 当 所 
引用 的 对 象 在 虚拟 机 内 不 再 有 强 引 用 时 ,GC 后 WeakReference 将 会 被 自动 回收 ; 
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SoftReference 与 WeakReference 的 特性 基本 一 致 ,最 大 的 区 别 在 于 SoftReference 会 尽 可 
能 长 地 保留 引用 直到 虚拟 机 内 存 不 足 时 才 会 被 回收 ,这 一 特性 使 得 SoftReference 非常 适合 
具体 的 内 存 分 配 流程 如 图 2. 8 所 示 。 


锁定 堆 
是 
一 | 回收 软 引用 对 象 
AR 


| 是 分 配 成 功 ? 
下 


一 一 |_ 记 录 分 配 结果 


返回 空 
堆 解锁 启动 垃圾 回收 记录 分 配 结果 
添加 到 跟踪 列表 堆 解锁 
1 抛 出 异常 
分 配 内 存 一 
a 
否 
增 大 堆 空间 并 分 配 
是 本 否 
开始 
图 2.8 内 存 分 配 


第 一 次 垃圾 回收 时 调用 函数 gcForMalloc(false) ,不 回收 软 引 用 对 象 。 而 第 二 次 垃圾 
回收 时 调用 函数 gcForMalloc(true) ,回收 软 引 用 对 象 。 总 共 进 行 4 次 分 配 尝 试 ,车 分 配 成 
功 ,返回 指向 内 存 区 域 的 指针 ,否则 返回 空 ,并 抛 出 OutOfMemoryError 异常 。 以 上 是 内 存 
分 配 过 程 的 分 析 结 果 ,结合 调试 工具 可 以 验证 分 析 结 果 的 正确 性 。 

利用 GDB 自动 调试 工具 可 以 获取 内 存 管理 的 堆栈 信息 ,取得 堆栈 信息 后 ,提取 出 堆栈 
中 的 函数 和 函数 调用 关系 ,利用 Python 脚本 转化 为 Graphviz 可 以 识别 的 dot 语言 ,然后 使 
用 dot 命令 生成 相应 的 函数 流程 图 ,绘制 的 流程 图 如 图 2.9 所 示 。 

从 流程 可 以 看 出 ,内 存 分 配 时 ,dvmMalloc 函数 首先 调用 dvmLockHeap 函数 进行 锁定 
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堆 , 然 后 调用 tryMalloc 函数 进行 分 配 尝试 ,其 中 tryMalloc 函数 中 调用 了 dvmHeapSourceAlloc 
函数 进行 分 配 堆 资 源 ,分 配 成 功 后 dvmMalloc 再 调用 dvmUnlockHeap 进行 解锁 堆 , 最 后 调 
用 dvmAddTrackAlloc 函数 进行 添加 跟踪 。 可 以 看 出 函数 执行 调用 流程 与 解析 代码 得 到 的 
流程 图 一 致 。 


JNL CreateJavaVM 


dvmLockHeap dvmAddTrackedAlloc 


dvmHeapSourceAlloc 


图 2.9 函数 流程 图 


2.3 垃圾 回收 过 程 分 析 


2.3.1 垃圾 收集 算法 


任何 垃圾 收集 算法 都 必须 做 两 件 事 ,首先 它 必须 检测 出 垃圾 对 象 。 其 次 , 它 必 须 回收 垃 
圾 对 象 所 使 用 的 堆 空间 并 还 给 程序 。 

垃圾 检测 通常 通过 建立 一 个 根 对 象 的 集合 以 及 建立 一 个 从 这 些 根 对 象 开始 能 够 触及 的 
对 象 集合 来 实现 。 如 果 正 在 执行 的 程序 可 以 访问 到 的 根 对 象 和 某 个 对 象 之 间 存 在 引用 路 
径 , 这 个 对 象 就 是 可 触及 的 。 对 于 程序 来 说 , 根 对 象 总 是 可 以 访问 的 。 从 这 些 根 对 象 开 始 ， 
任何 可 以 被 触及 的 对 象 都 被 认为 是 “活动 ”的 对 象 。 无 法 被 触及 的 对 象 被 认为 是 垃圾 ,因为 
它们 不 再 影响 程序 的 未 来 执行 。 

虚拟 机 的 根 对 象 集合 根据 实现 不 同 而 不 同 , 包 含 局 部 变量 中 的 对 象 引 用 和 栈 帧 的 操作 
数 栈 ( 以 及 类 变量 中 的 对 象 引 用 )、 被 加 载 的 类 的 常量 池 中 的 对 象 引 用 (比如 字符 串 ) ,传递 到 
本 地 方法 中 的 没有 被 本 地 方法 释放 的 对 象 引 用 。 任 何 被 根 对 象 引用 的 对 象 都 是 可 触及 的 ， 
从 而 是 活动 的 ,任何 被 活动 的 对 象 引 用 的 对 象 都 是 可 触及 的 ,程序 可 以 访问 任何 可 触及 的 对 
象 ,所 以 这 些 对 象 应 该 留 在 堆 中 ,而 对 于 那些 不 可 触及 的 对 象 , 程 序 没 有 办 法 访问 它们 ,应 该 
被 收集 和 释放 。 

区 分 活动 对 象 和 垃圾 的 两 个 基本 方法 是 引用 计数 和 跟踪 。 引 用 计数 垃圾 收集 器 通过 为 
堆 中 的 每 一 个 对 象 保存 一 个 计数 来 区 分 活动 对 象 和 垃圾 对 象 。 这 个 计数 记录 下 了 对 那个 对 
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象 的 引用 次 数 。 跟 踪 垃 圾 收集 器 实际 上 追踪 从 根 节点 开始 的 引用 图 。 在 追踪 中 遇 上 的 对 象 
以 某 种 方式 打上 标记 , 当 追 踪 结束 时 ,没有 被 打上 标记 的 对 象 就 被 判定 是 不 可 触及 的 ,可 以 
被 当 作 垃圾 收集 。 


1. 引用 垃圾 收集 器 


引用 计数 是 垃圾 收集 的 早期 策略 。 在 这 种 方法 中 , 堆 中 每 一 个 对 象 都 有 一 个 引用 计数 。 
当 一 个 对 象 被 创建 了 ,并 且 指 向 该 对 象 的 引用 被 分 配给 了 一 个 变量 ,这 个 对 象 的 引用 计数 被 
置 为 1。 当 任何 其 他 变量 被 赋值 为 对 这 个 对 象 的 引用 时 ,计数 加 1。 当 一 个 对 象 的 引用 超过 
了 生存 期 或 者 被 放置 一 个 新 的 值 时 ,对 象 的 引用 计数 减 1。 任 何 引用 计数 为 0 的 对 象 可 以 
被 当 作 垃圾 收集 。 当 一 个 对 象 被 垃圾 收集 的 时 候 , 它 引用 的 任何 对 象 计数 值 减 1。 在 这 种 
方法 中 ,一 个 对 象 被 垃圾 收集 后 可 能 导致 后 续 其 他 对 象 的 垃圾 收集 行动 。 

这 种 方法 的 好 处 是 ,引用 计数 垃圾 收集 器 可 以 很 快 地 执行 ,交织 在 程序 的 运行 之 中 。 这 
个 特性 对 于 程序 不 能 被 长 时 间 打 断 的 实时 环境 很 有 利 。 坏 处 就 是 ,引用 计数 无 法 检测 出 循 
环 ( 即 两 个 或 者 更 多 的 对 象 互 相 引 用 ) 。 循 环 的 例子 如 , 父 对 象 有 一 个 对 于 对 象 的 引用 , 子 对 
象 又 反 过 来 引用 父 对 象 。 这 些 对 象 永远 都 不 能 计数 为 0, 就 算 它们 已 经 无 法 被 执行 程序 的 
根 对 象 可 触及 。 还 有 一 个 坏处 就 是 ,每 次 引用 计数 的 增加 或 者 减少 都 带 来 额外 开销 。 

因为 引用 计数 方法 固有 的 缺陷 ,这 种 技术 现在 已 经 不 为 人 所 接受 。 现 实生 活 中 所 遇 到 
的 虚拟 机 更 有 可 能 在 垃圾 收集 堆 中 使 用 追踪 算法 。 


2. 跟踪 收集 器 


跟踪 收集 器 追踪 从 根 节点 开始 的 对 象 引 用 图 。 在 追踪 过 程 中 遇 到 的 对 象 以 某 种 方式 打 
上 标记 。 总 的 来 说 ,要 么 在 对 象 本 身 设置 标记 ,要 么 用 一 个 独立 的 位 图 来 设置 标记 。 当 追踪 
结束 时 ,未 被 标记 的 对 象 就 知道 是 无 法 触及 的 ,从 而 可 以 被 收集 。 

基本 的 追踪 算法 被 称 作 “ 标 记 清 除 算法 ”。 这 个 名 字 指 出 垃圾 收集 过 程 的 两 个 阶段 。 在 
标记 阶段 ,垃圾 收集 器 遍历 引用 树 ,标记 每 一 个 遇 到 的 对 象 。 在 清除 阶段 ,未 被 标记 的 对 象 
被 释放 ,使 用 的 内 存 被 返回 到 正在 执行 的 程序 。 在 Java 虚拟 机 中 ,清除 步骤 必须 包括 对 象 
的 终结 。 


3. 压缩 收集 器 


Java 虚拟 机 的 垃圾 收集 器 可 能 有 对 付 堆 碎 块 的 策略 。 标 记 并 清除 收集 器 通常 使 用 的 
两 种 策略 是 压缩 和 拷贝 。 这 两 种 方法 都 是 快速 地 移动 对 象 来 减少 堆 碎 块 。 压 缩 收集 器 把 活 
动 的 对 象 越过 空闲 区 滑动 到 堆 的 一 端 , 在 这 个 过 程 中 , 堆 的 另 一 端 出 现 一 个 大 的 连续 空闲 
区 。 所 有 被 移动 的 对 象 的 引用 也 被 更 新 ,指向 新 的 位 置 。 

更 新 被 移动 的 对 象 的 引用 有 时 候 通 过 一 个 间接 对 象 引 用 层 可 以 变 得 更 简单 。 不 直接 引 
用 堆 中 的 对 象 ,对 象 的 引用 实际 上 指向 一 个 对 象 句柄 表 。 对 象 句柄 才 指 向 堆 中 对 象 的 实际 
位 置 。 当 对 象 被 移动 了 ,只 有 这 个 句柄 需要 被 更 新 为 新 位 置 。 所 有 的 程序 中 对 这 个 对 象 的 
引用 仍然 指向 这 个 具有 新 值 的 句柄 ,而 句柄 本 身 没 有 移动 。 这 种 方法 简化 了 消除 堆 碎 块 的 
工作 ,但 是 每 一 次 对 象 访问 都 带 来 了 性 能 损失 。 


| 
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4. 拷贝 收集 器 


拷贝 垃圾 收集 器 把 所 有 的 活动 对 象 移动 到 一 个 新 的 区 域 。 在 拷贝 的 过 程 中 它们 被 紧 挨 
着 布置 ,所 以 可 以 消除 原本 它们 在 旧 区 域 的 空 阶 。 原 有 的 区 域 被 认为 都 是 空闲 区 。 这 种 方 
法 的 好 处 是 对 象 可 以 在 从 根 对 象 开 始 的 遍历 过 程 中 随 着 发 现 而 被 拷贝 ,不 再 有 标记 和 清除 
的 区 分 。 对 象 被 快速 拷贝 到 新 区 域 ,同时 转向 指针 仍然 留 在 原来 的 位 置 。 转 向 指针 可 以 让 
垃圾 收集 器 发 现 已 经 被 转移 的 对 象 的 引用 。 然 后 垃圾 收集 器 可 以 把 这 些 引 用 设置 为 转向 指 
针 的 值 , 所 以 它们 现在 指向 对 象 的 新 位 置 。 

一 般 的 拷贝 收集 器 算法 被 称 为 “停止 并 拷贝 "。 在 这 个 方案 中 , 堆 被 分 为 两 个 区 域 ,任何 
时 候 都 只 使 用 其 中 的 一 个 区 域 。 对 象 在 同一 个 区 域 中 分 配 ,直到 这 个 区 域 被 耗 尽 。 此 时 , 程 
序 执行 被 中 止 , 堆 被 遍历 ,遍历 时 遇 到 的 活动 对 象 被 拷贝 到 另 一 个 区 域 。 当 停止 和 拷贝 过 程 
结束 时 ,程序 恢复 执行 。 内 存 将 从 新 的 堆 区 域 中 分 配 ,直到 它 也 被 用 尽 。 那 时 程序 将 再 次 中 
止 ,遍历 堆 , 活 动 对 象 又 被 拷贝 回 原来 的 区 域 。 这 种 方法 带 来 的 代价 就 是 ,对 于 指定 大 小 的 
堆 来 说 需要 两 倍 大 小 的 内 存 。 因 为 任何 时 候 都 只 能 使 用 其 中 的 一 半 。 


2.3.2 关键 数据 结构 


1. GcHeap 结构 体 


GcHeap 结构 体 在 dalvik/ vm/alloc/ HeapInternal. h 文件 中 定义 ,以 下 为 结构 体 的 详细 分 析 。 
代码 清单 2.9 dalvik/vmyalloc/HeapInternal.h: GcHeap 结构 体 源 代码 


struct GcHeap { 
HeapSource * heapSouroe; 
A* 递归 过 程 中 找到 的 java/lang/ref/Reference 子 类 实例 的 链接 列表 。 
* 这 些 列表 在 CC 每 次 运行 时 清除 和 创建 * / 
Gbject * softReferenoes; 
Object * weakReferences7 
Gbject * finalizerReferenoes; 
Cbject * phantarReferenoes; 
Cbject * clearedReferenoes; xx 需要 和 人 列 的 引用 对 象 列表 * / 
GoMarkcontext markContext; Ax 标 记 步 又 当前 的 状态 ,只 在 一 个 垃圾 回收 期 间 有 效 * / 
Asx# 垃圾 回收 的 card table* / 
UL* cardrablepase; 
size t cardTableIengthy 
size t cardTrableMaxLengthy 
Size t cardTableOffset; 
bool gcRumning; sx 用 来 标记 垃圾 回收 是 否 运行 的 变量 ,避免 向 Gc 重 复 询 问 * / 
Asx 调试 控制 变量 值 * / 
int ddmHpsgnheny 
int ddrHpsgnhat7 
int danNhsgnheny 
int dcnNhsghat; 
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2. HeapBitmap 结构 体 


HeapBitmap 结构 体 在 dalvik/vm/ HeapBitmap. h 文件 中 定义 ,以 下 为 结构 体 的 详细 分 析 。 
代码 清单 2. 10 ”HeapBitmap 结构 体 源 代码 
struct HeapBitrep { 
Ax* 位 图 数据 ,指向 分 配 好 的 匿名 内 存 区 域 * / 
unsigned long * bits; 
Ax 使 用 过 的 内 存 大 小 * / 
size t bitsLen7 
Ax 分 配器 分 配 的 真实 的 内 存 大 小 * / 
size t allocreny 
A#x 基地 址 ,相当 于 位 图 中 的 第 一 位 * / 
uintptr t base; 
A# 最 高 地 址 * / 
Uintptr t max; 
}; 


2.3.3 关键 函数 


1. dvmHeapMarkRootSet 函数 


dvmHeapMarkRootSet 函数 在 dalvik/vm/alloc/MarkSweep. cpp 中 定义 , 源 代码 如 下 
所 示 ,函数 流程 图 如 图 2. 10 所 示 。 


开始 

通过 DvmGlobals 结 构 

体 ， 定 义 垃圾 回收 堆 一 | DVM 锁 定 互 斥 信号 量 
调用 dvmVisitRoots 函 数 访问 本 引用 表 
得 到 入 口 参数 visitor arg ET 

访问 哈 希 表 DVM 锁 定 互 斥 信号 量 
访问 原始 类 型 EE 
1 
DVM 解 锁 互 斥 信号 
访问 线程 


gDvmliteralStrings 是 否 为 空 ? 结束 


图 2.10 dvmHeapMarkRootSet 函数 流程 
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代码 清单 2. 11 dalvik/vm/alloc/MarkSweep. cpp: dvmHeapMarkRootSet() 源 代码 


Void dwrHearMarkRootset () 


{ 


: 
d 


GcHeap * gcHeap= gpum-gcHeapy 
dMarkIrmmmneCbjects (gcHeap- > markContext .immmeLimit); 
dnVisitRoots (rootMarkObjectVisitor, ggcHeap- > markContext); 


vmHeapMarkRootSet 是 对 标签 进行 相关 操作 中 的 关键 函数 ,该 函数 调用 了 


dvmMarkImmuneObjects 和 dvmVisitRoots 两 个 函数 。 该 函数 主要 实现 标记 一 套 对 象 。 首 


先 , 定 
内 容 。 


义 垃 圾 回收 堆 。 其 次 ,复制 存活 的 bit 向 量 内 容 到 标记 bit 向 量 , 使 gcHeap 指向 标记 
然后 进行 dvmVisitRoots 访问 根 操作 。 再 次 操作 中 ,首先 得 到 入 口 参数 visitor 和 


arg。 接 着 访问 哈 希 表 , 其 变量 为 visitor, gDvm. loadedClasses，ROOT_STICKY_CLASS， 
arg。 访 问 原始 类 型 ,变量 为 (visitor，arg)。 接 着 判断 gDvm. dbgRegistry 是 否 为 空 , 若 


gDvm. dbgRegistry 不 为 空 , 则 访问 哈 希 表 ; 若 为 
口 
空 则 判断 gDvm. literalStrings 是 否 为 空 , 若 
定义 垃圾 回收 标记 上 下 文 gDvm. literalStrings 不 为 空 , 则 访问 哈 希 表 ; 若 为 


空 则 继续 执行 后 续 操 作 DVM 锁定 互 斥 信号 量 ， 
访问 间接 的 引用 表 , DVM 解锁 互 斥 信 号 量 ， 


遍历 位 图 ,遍历 位 图 回调 


强制 类 型 转换 ,将 ULONG_MAX 指 针 赋值 给 fnger | DVM 锁定 互 斥 信号 量 , 访 问 引 用 表 ,DVM 解锁 


互 斥 信号 量 ,访问 线程 ,最 终结 束 。 


处 理 标记 栈 


2. dvmHeapScanMarkedObjects 函数 


dvmHeapScanMarkedObjects 在 dalvik/vm/ 


2.11 dvmHeapScanMarkedObjects 


alloc/ MarkSweep. cpp 中 定义 , 源 代码 如 下 所 示 ， 
函数 流程 图 如 图 2. 11 所 示 。 


函数 流程 图 


代码 清单 2.12 dalvik/vm/alloc/ MarkSweep. cpp: dvmHeapScanMarkedObjects() 源 代码 


void dunHeapScanMarkedcbjects (void) 


GoMarkContext * ctbx= ggDvm.gcHeap- > markContext; 

assert (ctx- > finger== NULD) 7 

px 遍历 位 图 ,浏览 每 个 对 象 * / 

dHeapBitmapScarWalk (ctx- > bitmap, scanBitmapCal lback, ctx) ; 
ctx > finger= (void * )ULONG Max; 

Ax 已 经 遍历 标记 位 图 了 。 浏 览 标记 栈 中 留 下 的 所 有 东西 * / 
ProcessMarkStack (ctx) 7 


dvmHeapScanMarkedObjects 函数 是 对 标记 栈 进行 相关 操作 中 的 关键 函数 。 主 要 实现 
给 定 根 标记 的 位 图 ,找到 并 且 标 记 所 有 可 触及 的 对 象 ,函数 返回 时 ,整个 存活 的 对 象 将 会 被 


标记 并 


# 上 且 标 记 栈 为 空 。 首 先 ,将 gDvm. gcHeap 一 markContext 地 址 赋 给 GcMarkContext 
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* ctx。 遍 历 位 图 ,遍历 位 图 回调 。 强 制 类 型 转换 ,将 ULONG_MAX 指针 赋值 给 finger。 
处 理 标 记 栈 ,已 经 遍历 标记 位 图 ,浏览 标记 栈 留 下 的 东西 。 


3. processMarkStack 函数 开始 
processMarkStack 在 dalvik/vm/alloc/ MarkSweep. cpp 获取 当前 GeMarkStack 


中 定义 , 源 代 码 如 下 所 示 ,函数 流程 图 如 图 2. 12 所 示 。 
代码 清单 2. 13 dalvik/vm/alloc/MarkSweep. 
cpp: processMarkStack() 源 代码 


Stack—>top>stack—>base? 2 


弹出 标记 栈 的 一 个 对 象 


static void prooessMarkStack (GdMarkContest * ctx) 
{ 


浏览 这 个 对 象 引用 


assert (ctx != NOLD); 
assert (ctx- > finger== (void * )UIONG MAX); 


assert (ctx- > stack.top >= ctx- > stack.base); 图 2. 12 ”processMarkStack 函数 流程 图 
GoMarkStack * stack= &ctx- > stack; 
// 声 明 栈 


// 姑 里 懂 现 水 所 栈 恢 > stack- >base) { 
const Cbject * cbj=markStackPop (stack); 
scancbject (cbj, ctx); 


} 


processMarkStack 函数 是 在 Dalvik 虚拟 机 垃圾 回收 的 标记 步骤 中 用 到 的 处 理 标记 栈 
的 关键 函数 。 我 们 知道 ,在 标记 过 程 中 用 标记 栈 MarkStack 存储 标记 的 根 对 象 , 栈 的 操作 
包括 弹出 Pop 和 压 人 Push, 在 这 个 函数 中 为 了 处 理 栈 中 的 对 象 的 信息 ,需要 弹出 栈 顶 的 对 
象 进 行 处 理 。 

困 数 首先 获得 当前 的 GcMarkStack, 然 后 循环 处 理 栈 顶 的 对 象 ,循环 条 件 是 stack 一 top 
大 于 stack-~~base, 即 栈 顶 top 的 地 址 大 于 栈 底 base 的 地 址 ,循环 体内 部 执行 两 个 主要 操作 ， 
一 个 是 弹出 栈 顶 的 一 个 对 象 ,调用 函数 markStackPop() , 另 一 个 是 浏览 弹出 的 这 个 对 象 , 调 
用 函数 scanObject()。 弹 出 对 象 时 首先 栈 顶 地 址 减 一 (一 stack 习 top) ,然后 返回 栈 顶 的 对 象 
元 素 * stack 一 top。 浏 览 对 象 时 ,根据 浏览 的 条 件 来 决定 浏览 对 象 的 类 型 ,浏览 类 对 象 
scanClassObject() ,浏览 数组 对 象 scanArrayObject() ,浏览 数据 对 象 scanDataObject() 。 


4. ptr2heap 函数 


ptr2heap 在 dalvik/vm/alloc/ HeapSource. cpp 中 定义 , 源 代码 如 下 所 示 ,函数 流程 图 如 
图 2.13 所 示 。 
代码 清单 2.14 dalvik/vm/alloc/HeapSource. cpp: ptr2heap() 源 代码 


static Heap * ptr2heap (Const HeapSource * hs,const void * ptr) 
{ 
const size t nurHef 得 到 内 航 并 卜 ps; 
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迁 (ptr !=NULL) { /如 果 指 针 不 为 空 
for (size t 话 舞 夫人 i 幅 eaps; 计 +) { 
const Fey 得 到 截 st heap= ghs- > heaps [i]; 


if ((const har * )ptr >=heap- >base && (Const har * )ptr< heap- > limit) 


Tebth 芭 创维 * )heap; 


retum NULL; // 返 回 空 


获取 入 口 参数 hs, ptr 


获取 堆 数 


将 HeapSource 结 构 体 中 的 
heaps 地 址 赋 给 heap 。 得 到 
HeapSource 中 当前 堆 的 数量 


ptr >= heap—>base &&ptr < heap—>limit? 


返回 heap 指 针 


结束 
2.13 ”ptr2heap 函数 流程 图 


ptr2heap 主要 实现 返回 二 ptr 志 来 自 的 堆 , 如 果 它 不 来 自任 何 堆 则 返回 空 。 首 先 获取 入 
口 参数 hs 和 ptr。 其 次 获取 堆 数 。 接 下 来 ,判断 ptr 指针 是 否 为 NULL, 若 为 NULL, 则 返 
回 NULL; 若 不 为 NULL, 则 继续 执行 ,定义 分 配 大 小 i。 判断 i 二 numHeaps 是 否 成 立 , 若 不 
成 立 则 返回 NULL ,车 成 立 则 继续 执行 ,将 HeapSource 结构 体 中 的 heaps 地 址 赋 给 heap。 
得 到 HeapSource 中 当前 堆 的 数量 。 接 着 ,判断 (const char * )ptr 二 一 heap 一 base &&. 
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(const charx )ptr<heap 一 limit 是 否 成 立 , 若 不 成 立 , 则 返回 上 一 层 判 断 i 二 numHeaps 是 
否 成 立 并 且 进 行 循环 ; 若 成 立 则 返回 heap 指针 。 最 终结 束 。 


2.3.4 垃圾 回收 流程 


Dalvik 虚拟 机 在 垃圾 回收 时 使 用 Mark Sweep 算法 ,该 算法 一 般 分 为 Mark 阶段 和 
Sweep 阶段 。Mark 阶段 就 是 标记 出 活动 对 象 ,使 用 栈 来 保存 根 集合 ,然后 对 栈 中 的 每 一 个 
元 素 , 递 归 追 踪 所 有 可 访问 的 对 象 , 对 于 所 有 可 访问 的 对 象 . 在 markBits 位 图 中 将 该 对 象 的 
内 存 起 始 地 址 对 应 的 位 设 为 1。 这样 当 栈 为 空 时 ,markBits 位 图 就 是 所 有 可 访问 的 对 象 集 
合 。 垃 圾 收集 的 第 二 步 就 是 回收 内 存 ,在 Mark 阶段 通过 markBits 位 图 可 以 得 到 所 有 可 访 
问 的 对 象 集合 ,而 liveBits 位 图 表示 所 有 已 经 分 配 的 对 象 集合 。 因 此 通过 比较 这 两 个 位 图 ， 
liveBits 位 图 和 markBits 位 图 的 差异 就 是 所 有 可 回收 的 对 象 集合 。 

虚拟 机 的 根 对 象 包含 局 部 变量 中 的 对 象 引 用 和 栈 帧 的 操作 数 栈 (以 及 类 变量 中 的 对 象 
引用 ) 被 加 载 的 类 的 常量 池 中 的 对 象 引 用 (比如 字符 串 ) 传递 到 本 地 方法 中 的 没有 被 本 地 
方法 释放 的 对 象 引 用 。 所 有 这 些 加 入 到 一 个 集合 中 ,被 称 为 根 集合 。 然 后 从 根 集合 开始 , 递 
归 查 找 可 以 从 根 集合 出 发 访问 的 对 象 ,Mark 过 程 又 被 称 为 追踪 ,追踪 所 有 可 被 访问 的 对 
象 ,任何 被 根 对 象 引用 的 对 象 都 是 可 触及 的 ,从 而 是 活动 的 ,任何 被 活动 的 对 象 引 用 的 对 象 
都 是 可 和 触及 的 ,程序 可 以 访问 任何 可 和 触及 的 对 象 . 所 以 这 些 对 象 应 该 留 在 堆 中 ,而 对 于 那些 
不 可 触及 的 对 象 ,程序 没有 办 法 访问 它们 ,应 该 被 收集 和 释放 。 上 有 具体 的 垃圾 回收 流程 如 
图 2.14 所 示 。 


开始 重新 标记 根 集合 
锁 住 堆 二 
挂 起 所 有 线程 a 
标记 根 集合 交换 markBits 和 liveBits 
唤醒 所 有 线程 唤醒 所 有 进程 
从 根 开始 标记 对 象 清除 未 标记 对 象 
挂 起 所 有 线程 堆 解锁 


2.14 垃圾 回收 


利用 获取 到 的 堆栈 信息 得 到 垃圾 回收 的 流程 图 如 图 2. 15 所 示 。 从 图 中 可 以 看 到 ,在 垃 
圾 回收 时 ,dvmCollectGarbageInternal 函数 依次 调用 dvmHeapScanMarkedObjects 函数 和 
processMarkStack 函数 ,dvmHeapScanMarkedObjects 函数 调用 dvmHeapBitmapScanWalk 
函数 ,并 浏览 对 象 。 得 到 的 垃圾 回收 流程 与 解析 代码 分 析 的 流程 图 如 图 一 致 。 
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dvmAsmSisterStart 
allocArray 


dvmCollectGarbageInternal 


dvmHeapScanMarkedObjects processMarkStack 
dvmHeapBitmapScan Walk 


2.15 垃圾 回收 验证 流程 图 


小 结 


内 存 管理 是 Android 系统 Dalvik 虚拟 机 的 一 个 关键 部 分 ,优秀 可 靠 的 内 存 管理 机 制 能 
够 为 系统 及 程序 的 顺畅 运行 保驾 护航 。 本 章 在 分 析 源 代码 的 基础 上 分 析 了 内 存 管理 机 制 中 
的 关键 数据 结构 以 及 涉及 的 关键 的 函数 流程 ;分 析 了 内 存 分 配 算法 流程 和 内 存 回收 的 算法 
原理 ,较为 全 面 地 分 析 了 Dalvik 虚拟 机 的 内 存 管理 机 制 。 


第 | 3 童 
JNI 模 块 的 原理 及 实现 


本 章 主 要 内 容 


局 如 何 使 用 JNI 机 制 编写 应 用 程序 ? 

避 Dalvik 虚拟 机 建立 JNI 机制 环 境 的 过 程 是 怎样 的 ? 
名 JNI 机制 涉及 的 关键 数据 结构 有 哪些 ? 

名 JNI 机制 涉及 的 关键 函数 有 哪些 ? 

Java 代码 调用 C 代码 执行 流程 是 怎样 的 ? 

CC 代码 调用 Java 代码 执行 流程 是 怎样 的 ? 


大 多 数 的 Android 应 用 程序 都 是 由 Java 语言 编写 的 ,但 是 在 一 些 情况 下 本 地 语言 
(C/C++ ) 也 是 不 可 缺少 的 ,本 章 将 介绍 在 Android 应 用 开发 中 何 时 使 用 本 地 语言 ? 那么 ， 
本 地 代码 和 Java 代码 是 怎样 统一 起 来 的 ?又 是 怎样 相互 调用 的 呢 ? 本 章 以 分 析 源 代码 为 
基础 和 根据 ,向 读者 一 一 解答 Dalvik 虚拟 机 中 JNI 机 制 的 诸多 疑问 。 


3.1 何 时 使 用 JNI 


Java 本 地 调用 接口 英文 全 称 为 Java Native Interface, 简 称 为 JNI, 是 Sun 公司 定义 的 
一 套 编程 框架 标准 接口 ,允许 Java 代码 和 本 地 代码 互相 调用 。 本 地 代码 是 指 那些 使 用 Java 
语言 之 外 的 编程 语言 编写 的 代码 。Android 系统 的 Dalvik 虚拟 机 实现 了 这 套 接口 , 供 
Dalvik 虚拟 机 的 Java 应 用 与 本 地 代码 实现 互相 调用 。 

点 所 ”可 以 访问 http://docs. oracle. com/javase/7/docs/technotes/guides/jni/spec/ 
jniTOC. html 来 获取 Sun 公司 针对 JNI 的 说 明文 档 。 

通常 在 下 列 几 种 情况 下 使 用 JNI 技术 。 

(1) 需要 注重 处 理 速 度 。 和 本 地 代码 (C/C++ 等 ) 相 比 ,Java 代码 的 执行 速度 相对 慢 一 
些 。 如 果 对 某 段 程序 的 执行 速度 有 和 较 高 的 要 求 , 建 议 使 用 C/C++ 编写 代码 。 而 后 在 Java 
中 通过 JNI 调用 基于 C/C++ 编写 的 部 分 ,常常 能 够 获得 更 快 的 运行 速度 。 例 如 ,在 图 形 处 
理 等 需要 大 量 计算 的 情况 下 通常 会 广泛 地 使 用 JNI 机 制 。 

(2) 直接 进行 硬件 控制 。 为 了 更 好 地 控制 硬件 ,硬件 控制 代码 通常 使 用 C 语言 编写 。 
而 后 借助 JNI 将 其 与 Java 层 连接 起 来 ,从 而 实现 对 硬件 的 控制 。Dalvik 虚拟 机 使 用 一 些 本 
地 代码 编写 的 已 编译 的 代码 库 与 硬件 .操作 系统 直接 进行 交互 。 
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(3) 对 既 有 本 地 代码 的 复 用 。 在 程序 编写 过 程 中 ,常常 会 使 用 一 些 已 经 编写 好 的 本 地 
代码 (如 C/C++ 代码 ), 既 提高 了 编程 效率 ,又 确保 了 程序 的 安全 性 与 健壮 性 。 在 复 用 这 些 
本 地 代码 时 ,就 要 通过 JNI 本 地 调用 接口 来 实现 。 

因此 ,使 用 JNI 的 优点 主要 在 于 可 以 直接 重用 一 些 数量 庞大 的 本 地 代码 ,对 于 那些 性 能 
要 求 比较 高 的 代码 而 言 ,通过 JNI 机 制 使 用 本 地 代码 可 以 增强 程序 的 性 能 ,减少 功 耗 , 特 别 
是 对 于 内 存 较 小 .CPU 运算 速度 有 限 和 电池 电量 不 够 充沛 的 戏 和 人 式 移动 手机 设备 而 言 , 提 
高 性 能 减少 功 耗 这 一 点 就 显得 尤为 重要 。 然 而 ,使 用 JNI 调用 接口 也 会 带 来 一 些 负面 影响 ， 
比如 有 些 时 候 失 去 了 平台 的 可 移植 性 ,但 是 从 综合 角度 考虑 ,在 有 些 情 况 下 ,JNI 机 制 带 来 
的 优点 要 大 于 它 的 缺点 。 


3.2 JNI 编程 示例 


3.2.1 加 载 动 态 链 接 库 


Android 系统 应 用 层 的 类 都 是 以 Java 语言 编写 的 ,这 些 Java 类 被 编译 为 包含 字 节 码 的 
Dex 文件 之 后 ,需要 依靠 Dalvik 虚拟 机 来 执行 。 如 果 Dalvik 虚拟 机 在 执行 Java 类 的 过 程 
中 ,需要 和 本 地 代码 进行 沟通 传递 信息 ,这 时 Dalvik 虚拟 机 就 需要 加 载 本 地 代码 部 分 的 组 
件 , 即 由 本 地 代码 编译 好 的 . so 动态 链接 库 , 然 后 Java 类 就 能 够 和 本 地 代码 中 的 函数 顺利 地 
实现 互相 调用 。 可 以 说 ,这 时 Dalvik 虚拟 机 扮演 着 桥梁 的 角色 ,让 Java 代码 和 本 地 代码 实 
现 通 过 JNI 机制 而 相互 沟通 。Java 代码 通过 System. loadLibrary(“. so 动态 链接 库 名 称 ”) 
语句 加 载 动 态 链接 库 , 当 虚拟 机 执行 这 条 语句 时 ,虚拟 机 就 会 去 Android 系统 的 /system/ 
lib 目录 下 查找 指定 名 称 的 动态 链接 库 ,/system/lib 下 存放 着 Android 系统 的 系统 应 用 程 
序 和 用 户 应 用 程序 执行 需要 的 动态 链接 库 , 并 在 解析 名 称 的 同时 将 名 称 加 上 “lib” 前 级 组 成 
完整 的 动态 链接 库 名 称 。 


3.2.2 声明 本 地 函数 


如 果 在 Java 类 中 要 使 用 本 地 函数 ,那么 首先 需要 在 Java 类 中 声明 它 。 声 明 本 地 函数 
时 ,要 在 函数 名 前 添加 “native” 关 键 字 进行 修饰 ,例如 ,如 下 语句 就 声明 了 一 个 本 地 函数 
“add”。 在 Java 类 中 声明 完 本 地 函数 之 后 ,利用 Java 中 的 javac 命令 编译 Java 文件 生成 
class 文件 ,然后 利用 javah 命令 使 用 class 文件 生成 C/C++ 本 地 语言 的 . h 头 文件 , 头 文件 
以 本 地 语言 的 方式 声明 本 地 函数 .便于 后 续 本 地 函数 实现 时 使 用 。 

代码 清单 3.1 手动 编写 声明 本 地 函数 源 代码 


static native int add (int a, int b); 


3.2.3 实现 本 地 函数 


在 Java 文件 中 声明 完 本 地 函数 之 后 , 接 下 来 就 应 该 在 C/C++ 本 地 语言 文件 中 实现 本 
地 函数 ,将 想 要 实现 的 函数 功能 利用 本 地 函数 实现 。 如 下 即 为 对 上 述 声 明 的 “fun” 本 地 函数 
的 实现 。 

代码 清单 3.2 手动 编写 实现 本 地 函数 源 代码 
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static jint add (JNIFEnv * env,jabject thiz, jint a,jint b) { 
int result=atb; 

IOGI ("Sd+ $d= $d",a,b, result); 

retum result; 


} 
本 地 函数 的 参数 和 返回 值 类 型 根据 等 价 约定 映射 到 Java 语言 中 的 数据 类 型 ,Java 语言 
中 存在 两 种 数据 类 型 : 基本 类 型 和 引用 类 型 。 在 Dalvik 虚拟 机 的 JNI 接口 层 ,也 存在 着 类 
似 的 数据 类 型 ,与 Java 比较 起 来 ,其 范围 更 具 严 格 性 。 基 本 数据 类 型 ,如 int float char 等 ; 
引用 类 型 ,如 类 对象 .数组 等 。 如 表 3. 1 所 示 为 JNI 基本 类 型 的 类 型 映射 。 
表 3.1 JNI 基 本 类 型 的 类 型 映射 


Java 类 型 | 本 地 类 型 描 述 Java 类 型 | 本 地 类 型 描 述 
boolean | jboolean | C/C++ 8 位 整 型 int jint C/C++ 带 符号 的 32 位 整 型 
byte jbyte C/C++ 带 符号 的 8 位 整 型 long jlong C/C++ 带 符 号 的 64 位 整 型 
char jchar C/C++ 无 符号 的 16 位 整 型 float jfloat C/C++ 32 位 浮 点 型 
short jshort C/C++ 带 符号 的 16 位 整 型 double | jdouble | C/C++ 64 位 浮 点 型 


关于 原始 类 型 的 类 型 映射 在 源 代码 jni. h 头 文件 中 声明 。 在 Java 语言 中 原始 类 型 可 以 
直接 使 用 ,进行 赋值 .参数 传递 等 操作 ,而 数组 、 对 象 等 数据 类 型 只 能 通过 引用 进行 操作 和 存 
取 , 对 于 引用 的 类 型 映射 JNI 也 有 相应 的 定义 , 源 代码 在 头 文件 jni. h 中 ,如 表 3. 2 所 示 为 
JNI 引 用 数据 类 型 的 类 型 映射 。 


表 3.2 JNI 引 用 数据 类 型 的 类 型 映射 


Java 类 型 本 地 类 型 描 述 
Object jobject 任何 Java 对 象 ,或 者 没有 对 应 Java 类 型 的 对 象 
Class jclass Class 对 象 
String jstring 字符 串 对 象 
Object[ ] jobjectArray 任何 对 象 的 数组 
boolean[ ] jbooleanArray 布尔 型 数组 
byte[ ] jbyteArray 比特 型 数组 
char[] jcharArray 字符 型 数组 
short[] jshortArray 短 整 型 数组 
int[] jintArray 整 型 数组 
long[ ] jlongArray 长 整 型 数组 
float[] jfloatArray 浮 点 型 数组 
double[ ] jdoubleArray 双 浮 点 型 数组 


如 图 3. 1 所 示 为 JNI 类 型 中 引用 类 型 的 继承 关系 ,可 以 对 具有 父子 关系 的 类 型 进行 


转换 。 


从 上 述 的 本 地 函数 实现 代码 中 可 以 看 到 .一 个 本 地 函数 有 两 个 固定 的 函数 参数 ,一 个 是 
JNIEnvx 类 型 的 指针 ,一 个 是 jobject 类 型 ,如 果 本 地 方法 为 静态 的 ,那么 jobject 类 型 的 参 
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数 就 替换 为 jclass 类 型 的 参数 。 如 果 除 了 这 两 个 固定 参数 还 有 其 他 参数 , 则 根据 类 型 映射 
定义 转化 为 相应 类 型 的 参数 传人 函数 中 。 在 本 地 函数 的 实现 函数 体 中 可 以 访问 Java 类 的 
成 员 函 数 或 者 成 员 变量 ,这 时 ,Java 类 中 的 信息 传递 到 本 地 函数 中 。 本 地 函数 可 以 通过 JNI 
本 地 函数 调用 接口 来 访问 Java 类 中 的 成 员 ,例如 ,可 以 调用 GetMethodID 函数 获取 Java 类 
中 方法 的 ID ,调用 GetFieldID 获取 Java 类 中 的 成 员 变 量 ID ,调用 CallVoidMethod 方法 调 


用 Java 类 中 的 方法 等 。 
jobject (all objects) 
jclass (java.lang.Class instances) 
jstring (java.lang.String instances) 
jarray (arrays) 
jobjectArray (Object[]) 
| 一 一 jboolenArray (boolen[]) 
上 -一 jbyteArray (byte[]) 
jcharArray (char[]) 
jshortArray (short[]) 
jintArray (int[]) 
jlongArray (long[]) 
-一 一 jfloatArray (foat[]) 
jdoubleArray (double[]) 
jthrowable (java.lang.Throwable objects) 


图 3.1 引用 类 型 的 继承 关系 


Dalvik 虚拟 机 使 用 了 不 同 于 传统 Java JNI 的 方式 来 定义 虚拟 机 的 本 地 函数 。 其 中 一 
个 很 重要 的 区 别 是 Dalvik 虚拟 机 使 用 了 一 种 Java 代码 和 本 地 代码 函数 的 映射 表 数 组 ,并 在 
其 中 描述 了 函数 的 参数 和 返回 值 。 这 个 数组 的 类 型 为 JNINativeMethod, 例 如 ,上 述 定义 的 
本 地 函数 “fun” 利 用 此 类 型 定义 如 下 。 

代码 清单 3.3 手动 编写 fun 函数 的 JNINativeMethod 类 型 数组 定义 源 代码 


static JNINativeMethod methods[]= { 

fnianvwGDIw (void* )fun }, 

»; 

JNINativeMethod 结构 体 的 定义 在 头 文件 jni. h 中 ,结构 体 的 具体 定义 内 容 如 下 。 

代码 清单 3.4 dalvik/libnativehelper/include/nativehelper/jni. h: JNINativeMethod 

结构 体 源 代码 

typedef struct { 

const har* name; 
const char* signature; 
Voidx fnptr; 

JNINativeMethod 结构 体 的 成 员 变 量 “*name” 是 函数 的 名 字 ,“signature” 是 描述 函数 的 
参数 和 返回 值 的 函数 签名 ,“fnPtr” 是 函数 指针 ,指向 本 地 函数 。 需 要 进一步 说 明 的 是 第 二 
个 成 员 *signature”, 签 名 中 的 字符 实际 上 是 与 函数 的 参数 类 型 和 返回 类 型 一 一 对 应 的 。 
“QO ”中 的 字符 表示 参数 .后 面 的 则 代表 返回 值 .例如 ,“()V” 就 表示 返回 值 为 void 并 且 没 有 
参数 的 一 个 函数 的 签名 ,而 本 文 上 述 的 fun 方法 的 签名 为 “(ID1” ,表示 返回 值 为 int, 并 且 具 
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有 两 个 int 类 型 的 传人 参数 。Dalvik 虚拟 机 的 JNI 机制 中 对 具体 的 签名 字符 对 应 关系 作 了 
定义 ,具体 的 签名 字符 对 应 关系 如 表 3. 3 所 示 。 

表 3.3 和 表 3. 4 所 述 都 是 基本 类 型 ,如 果 Java 函数 的 参数 是 class, 则 以 *L? 开 头 , 以 
“;” 结 尾 ,中 间 是 用 “/” 隔 开 的 包 及 类 名 。 而 其 对 应 的 本 地 函数 名 的 参数 则 为 jobject。 一 个 
例外 是 String 类 ,其 对 应 的 本 地 类 型 为 jstring。 如 果 Java 函数 位 于 一 个 戏 入 类 , 则 用 $ 作 
为 类 名 间 的 分 隔 符 。 

数组 则 以 “[ ?开始 ,用 两 个 字符 表示 ,如 表 3.4 所 示 。 


表 3.3 签名 字符 对 应 表 表 3.4 数组 签名 字符 对 应 表 
字符 Java 类 型 本 地 类 型 字符 Java 类 型 本 地 类 型 

void void [I jintArray int[] 

Zz jboolean boolean [F jfloatArray float[] 
jn a [B te hdy byte[] 

jlong long [C | jcharArray char[] 

D jdouble double 

F jfloat float ES | Soray hor 

B Fe byte [LD jdoubleArray double[ ] 

[| jchar char [0 jlongArray long[ ] 

S jshort short [Zz jbooleanArray boolean[ ] 


3.2.4 实现 JNL Onload 函数 


当 Dalvik 虚拟 机 执行 到 System. loadLibrary() 函 数 时 ,首先 会 去 执行 本 地 代码 库 里 的 
JNI_OnLoad() 函 数 。 它 的 用 途 有 以 下 两 方面 。 

(1) 告诉 虚拟 机 此 本 地 动态 链接 库 使 用 哪 一 个 JNI 版本。 如 果 *. so 库 没有 提供 JNI_ 
OnLoad() 函 数 , 虚 拟 机 会 默认 该 * . so 挡 是 使 用 默认 JNI 版 本 。 由 于 新 版 的 JNI 做 了 许多 


扩充 ,如 果 需 要 使 用 JNI 的 新 版 功能 ,例如 JNI 1. 4 的 java. nio. ByteBuffer, 就 必须 由 JNI_ 


OnLoad() 函 数 来 告知 虚拟 机 。 

(2) 正 因为 虚拟 机 执行 到 System. loadLibrary() 函 数 时 ,会 立即 执行 JNI_OnLoad() 函 
数 ,所 以 本 地 动态 链接 库 的 开发 者 可 以 通过 JNI_OnLoad() 函 数 来 实现 本 地 库 内 的 一 些 变 
量 的 初始 化 工作 ,下 面 就 是 一 个 JNLOnLoad() 函 数 的 具体 实现 。 

代码 清单 3.5 手动 编写 JNI_Onload() 源 代码 


jint JNI nLIoad(JavaM* wm,void* reserved) 

{ 

Ax 声明 变量 ,并 对 变量 进行 初始 化 * / 
UnionJNIFEnVToVoid uenv; 
Uerv .very—= NULL; 
jint result=- 1; 
JUNIEnvx em 一 NULL7 

xx 获得 虚拟 机 的 env 本 地 接口 函数 指针 x / 
证 (vm- > GetEnv (&uenv.venv, JNI VERSION 1 4) !=JNI ON 
{ 
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hx# 若 发 生 错误 ,打印 错误 信息 ,进入 错误 处 理 代码 段 * / 
IOGE ("FRROR: GetEnv failed"); 
goto bail; 


ENnV= UenV .env; 
xx 注册 相应 的 本 地 函数 ,这 里 是 “acd” * / 
if (registerNatives (env) (=JNI TRUE) 


xx 车 注册 失败 ,打印 错误 信息 ,进入 错误 处 理 代码 段 * / 
IOGE ("FRROR: registerNatives failed"); 
goto bail; 


hx 设置 DT 版 本 为 NT VERSION 1 4 * / 
result= UNT VERSION 1 4; 

bail: 
retum result; 

} 


这 个 JNI_OnLoad0 〇 函数 返回 JNI_VERSION_1_4 值 给 虚拟 机 ,于 是 Dalvik 虚拟 机 知 
道 了 其 所 使 用 的 JNI 版 本 。 此 外 , 它 也 做 了 一 些 初 期 的 初始 化 的 操作 , 见 以 下 代码 段 。 
代码 清单 3.6 手动 编写 注册 本 地 函数 源 代码 


if (registerNatives (env) = JNI_TRUE) 
{ 
TOGE ("FRROR: registerNatives failed"); 
goto bail; 
} 
将 此 本 地 动态 链接 库 提供 的 各 个 本 地 函数 注册 到 Dalvik 虚拟 机 里 ,以 便 能 加 快 后 续 调 
用 本 地 函数 的 效率 。 
点 拨 在 JNI 编 程 过 程 中 ,JNL Onload() 函 数 并 不 是 必需 的 ,如 果 程 序 中 没有 实现 JNI_ 
Onload() 函数 ,虚拟 机 会 调用 默认 的 JNI Onload() 函 数 。 
此 外 ,Dalvik 虚拟 机 的 JNI 机 制 还 提供 JNILOnUnload() 函 数 。JNILOnUnload() 函数 
是 与 JNLOnLoad() 相 对 应 的 。 在 加 载 本 地 函数 库 时 会 立刻 调用 JNI_OnLoad() 函数 来 进 
行 本 地 代码 的 初期 动作 ;而 当 虚 拟 机 释放 该 本 地 函数 库 时 , 则 会 调用 JNI_OnUnload() 函 数 
来 进行 清除 动作 。 无 论 虚 拟 机 调用 JNI_OnLoad() 函数 还 是 JNI_Unload() 函 数 ,都 会 将 虚 
拟 机 的 指针 传递 给 它们 ,其 函数 原型 如 下 : 
jint UNT load(JavaM* Vmvoid* reserved) {  } 
jint JNI Mnload(JavaM* wmvoid* reserved){ } 


3.3 JNI 机 制 环境 的 建立 


在 Zygote 进程 启动 过 程 中 会 创建 一 个 AndroidRuntime 类 的 对 象 , 调用 
AndroidRuntime: :start 方法 完成 Zygote 进程 的 启动 工作 ,并 且 调 用 JNI_CreateJavaVM 
函数 启动 Dalvik 虚拟 机 。 下 面 将 详细 介绍 AndroidRuntime:: start 方法 和 JNI_ 
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CreateJavaVM 函数 。 
3.3.1 AndroidRuntime 类 的 start 方法 


AndroidRuntime: :start( ) 方法 的 主要 作用 是 启动 Android 的 运行 时 环境 。 在 
AndroidRuntime: :start( ) 函数 中 定义 Android root 的 目录 为 “/system”。 然 后 调用 
AndroidRuntime: :startVm() 函 数 启动 虚拟 机 。 启 动 虚拟 机 之 后 调用 AndroidRuntime:: 
startReg() 函 数 注册 Android 系统 的 内 部 本 地 方法 。 之 后 声明 一 个 jobjectArray 类 型 的 数 
组 用 来 存放 将 要 执行 的 Java 类 的 类 名 和 选项 字符 串 。 然 后 调用 JNI 本 地 调用 接口 函数 env 
一 FindClass() 查 找 要 执行 的 类 ,之 后 调用 env 一 GetStaticMethodID() 函 数 取 得 这 个 类 的 
main 方法 ,然后 调用 env 一 CallStaticVoidMethod() 函 数 执 行 这 个 main 方法 。 

代码 清单 3.7 framework/base/core/jni/ AppRuntime. cpp: AndroidRuntime: : start() 源 
代码 


void AndroidRintime: :start (const har* className,const har* options) 
{ 
IOD(\m >>>>>RndroidRuntime SIART $s<<<<<<\n", 
ClassName !=NULL?className : "(unknom)"); 


blockSigpipe(); 
if (stramp (options, "start— system server")==0) { /验证 命令 行 字符 串 
const int IOG_ BOOT PROGRESS STRRT= 3000; 
IOG EVENT ICNG (LOG BOOT PROGRESS START, 
Ds2mns (systentTime (SYSTEM _ TIME MCNOTCNTC) ))7 


const char* rootDir= getenv("RNDROID ROOT) 7 // 创 建 根 目录 
if (rootDir==NULD) { 
rootDir= "/system"; // 创 建 /system 目 录 
证 (!hasDir("/system")) { // 如 果 /system 已 存在 
IOG FATAL ("No root directory specified,and /android does not exist."); 
retum; 


小 
setenv ("ANDROID ROOT rootDir,1); 


//const har* kemelHack= getenv ("ID ASSUME, KFFNFL"); 
/IOGD ("Found ID ASSUME, FEFNET= '%5'\n",kemelHack); 


JNIFErv* env; 

if (startvin(amJavaVM genv) !=0) { // 调 用 startvin() 
retum; 

} 

onVirCreatedqd (env) ; 

证 (startReg(env)<0) { // 注 册 函 数 


IOGE ("Unable to register all android natives\n"); 
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retum; 
} 
jclass stringclass; 
jobjectArray strarray; 
jstring classNameStr; 
jstring optionsstr; 


stringclass= env- > Findclass ("java/lang/String"); 
assert (stringClass !=NULD); 
strArray= env- >NewCbjectarray(2,stringClass,NULD) 7 
assert (strArray ‘=NULD); 
classNameStr= env- >NewStringUTF (className) ; 
assert (ClassNameStr !=NULD)7 
env- > SetObjectArrayElement (strArray, 0, classNameStr); 
optionsStr= env- >NewStringUTF (options); 
env- > SetGbjectarrayElement (strArray, 1, optionsstr) ; 
Char* slashClassName= toSlashClassName (className); 
jclass startClass= env- > Findclass (slashClassName); 
if (startclass==NULD) { 如 果 类 名 为 空 
IOGE ("UavavM unable to locate class '%s'\n",slashClassName); 
} else { 
JjmethodTID startMeth= env- > GetStaticMethodTD (startClass, "main", 
"([Ljava/lang/sString; )V"); 
if (startMeth==NULD) { 
IOGE ("JavaM unable to find main() in '%s'\n",className); 
} else { 
env- > CallSstaticVoidMethod (startClass, startMeth, strArray); 


#if 0 
if (env- > Exosptioncheck()) 
threadExitUncaught Exosption (env) ; 
#endif 
} 
free (slashClassName); 


} 


IOGD("Shutting dom WM\n"); 
if (mJavaM- > DetachourrentThread() !=JNI CN 
IOW ("Waming: unable to detach main thread\n"); 
if (avaVM > DestroyJavaM() !=0) 
IOGW(Warming: WM did not shut dom cleanly\n"); 


// 查 找 类 


/创建 新 数组 


// 设 置 数组 元 素 


// 设 置 数组 元 素 
// 设 置 类 名 
/查找 类 


// 找 到 main 方 法 


// 调 用 函数 


// 检 查 异常 


// 释 放 资 源 


AndroidRuntime: :startVm() 函 数 的 主要 作用 是 启动 Dalvik 虚拟 机 。 首 先 通过 调用 
property_get() 函 数 来 获取 Android 系统 的 各 个 属性 ,Android 系统 的 属性 包括 两 部 分 : 文 


件 保存 的 持久 


属性 和 每 次 开机 导入 的 cache 属性 。 将 获得 的 系统 属性 存放 在 各 个 相关 数组 
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中 ,并 声明 了 一 个 JavaVMOption 结构 体 类 型 的 向 量 Vector 近 JavaVMOption 二 mOption， 
用 来 存放 一 部 分 获得 的 系统 属性 ,调用 mOption. add(opt) 函数 将 属性 添加 到 向 量 中 。 设 置 
version 为 JNL_VERSION_1_ 4, 然后 调用 JNIL_CreateJavaVM() 函数 建立 并 初始 化 Dalvik 
虚拟 机 。 

点 所 Android 系统 运行 需要 的 资源 也 是 在 Zygote 进程 创建 时 加 载 进来 的 。 

AndroidRuntime: :startReg() 函 数 的 主要 作用 是 注册 Android 系统 的 内 部 本 地 函数 。 
函数 调用 了 register_jni_procs(gRegJNI，NELEM(gRegJNI) ，env) 进 行 注册 ,gRegJNI 参 
数 是 一 个 RegJNIRec 结构 体 类 型 的 数组 ,里 面 存放 的 是 执行 每 个 需要 注册 的 函数 。 


3.3.2 JNL_CreateJavaVM() 函数 


JNI_CreateJavaVM() 的 主要 功能 是 创建 Dalvik 虚拟 机 ,在 dalvik/vm/Jni. cpp 中 定 
义 , 当 前 的 线程 会 变 为 虚拟 机 的 主线 程 。 首 先 程序 检查 JavaVMInitArgs * 类 型 参数 args 
的 version 成 员 变 量 是 否 大 于 JNI_VERSION_1_2, 如 果 小 于 JNI_VERSION_1_2, 则 返回 
错误 信息 JNI_EVERSION。 然 后 建立 JNIEnv 和 VM 的 结构 ,声明 一 个 JavaVMExt * 类 
型 的 变量 pVM, 并 对 其 分 配 内 存 空间 和 初始 化 ,并 且 声 明 一 个 JNIEnvExt * 类 型 的 变量 
pEnv, 调 用 dvmCreateJNIEnv() 函数 创建 JNI 本 地 调用 接口 函数 表 指 针 , 并 返回 给 变量 
pEnv。 如 图 3. 2 所 示 为 Dalvik 虚拟 机 创建 的 流程 。 如 代码 清单 3. 8 所 示 为 JNI_ 
CreateJavaVM 的 源 代码 。 

代码 清单 3.8 dalvik/vm/Jni. cpp: JNI_CreateJavaVM() 源 代码 


jint JNI CreateJavavM(UavaVM* * p vm,JNIFrv* * p env,void* vm args) { 
const JavaMInitArgs* args= (JavaWMInitArgs* ) vm args; // 获 取 参 数 
if (args- >version< UNT VERSION 1 2) { // 检 查 I 版 本 
retum JNI_ FEVERSION; 
} 


// TODO: don't allow creation of miltiple Ws - cne Per Customer for now 


memset (ggDvm, 0, sizeof (gpvm ); // 初 始 化 虚拟 机 内 存 区 域 
JavaWExt * pM (JavaWMExt * ) malloc (sizeof (JavaWMEext)); // 分 配 变 量 

memset (BM, 0, sizeof (JavaWMExt) ); // 初 始 化 变量 内 存 空间 
EWM- > funcTable= ggInvokeInterface; // 设 置 成 员 变 量 的 值 
EBM- > ervList= NULL; 

GmInitMitex (PWM- > ervListIock); // 初 始 化 信号 量 


UniquePtr< const char * []>argv(new const har* [args- > nOptions]); 
memset (argv.get () ,0,sizeof (har* ) * (args- >nOptions)); 


int arge= 0; 
for (int i=0; i<args->noptions; i++) { // 检 查 每 一 个 参数 选项 
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const har* optStr= args- > captions[i] .optionstring; 
if (optstr==NOLD) { 

dumEprintf (stderr, "ERROR: CreateJavaVM failed: argument $d was NULI\n",i); 

retum JNI FFR; 

} else if (stramp(optStr, viprintf")==0) { // 检 查 参 数 

gpvm-vfprintfHook= (int (* ) (EIE * ,const har* ,va list))args- > options[i] .extramnfo; 
} else if (stramp(optStr, "exit")==0) { 

gpm.exitHook= (void (* ) (int)) args- > captions[i] .extraInfo; 
} else if (stram (aptStr, "abort")==0) { 

gpm.abortHook= (void (* ) (void))args- > options[i] .extraInfo; 
} else if (stram (optStr, "sensitiveThread")==0) { 

gpm.issensitiveThreadHook= (pool (* ) (void))args- > oqptions[i] .extraInfo; 
} else if (stram (optStr, "- xcheck:jni")==0) { 

gpvmni.useCheckJni= true; 
} else if (stmamp (cptStr,"- Xjniopts:",10)==0) { 

char* jniopts= strdup (optStr +10); 

Size t jnioptCount= 1; 

for (ar* pjniopts; *p !=0;++p) { 

Et 
++ jnioptCount; 
*E0; 


} 
char* jniopt= jniopts; 


for (size t i=0; i< jnioptcount; ++i) { // 检 查 每 一 个 jni 选项 
证 (stram (jniopt, "wamonly")==0) { // 检 查 参 数 
gpmhni .wamonly= true; 
} else if (stram niopt, "foroecopy")==0) { 
gbvmni.forcecopy= true; 


} else if (stram (jniopt, "logThirdPartyJni")==0) { 
gpvmJni .logThirdPartyJni= true; 
} else { 
dumEbrintf (stderr, "ERROR: CreateJavaVM failed: unlmown - Xjniopts option '%s'\n", 
jniopt); 
retum JNI FFR; 
} 
jniopt += strlen Uniopt) +1; 
free (niopts); // 释 放 jni 选 项 
} else { 
/#* regular cpticn */ 
argv[largc+ + ]= optStr; 
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if (gpmhni .useCheckIni) { // 如 果 使 用 checejni 
dumrUseCheckedJniVin(GVM ; // 调 用 dmUsecheckJnivm() 
if gpumni.jnivm (=NULL) { // 如 果 jnivm 不 为 空 
GymEprintf (stderr, "ERROR: Dalvik cnly supports one WM per proocess\n"); 
retum JNI FFR; // 返 回 错误 


} 
gpmhni .jniVee (avavMx ) EWM; 


JNIFrvExt * peEnv= (JNIEnVExt* ) dumCreateJNIFEnv NULD); 
gpm.initializing= true; // 初 始 化 成 功 
std: :string status= 
mStartip (argc, argv.get () ,args— > jgnpreUnreccgnized, ONIPPV* )pEYN); 
// 调 用 dmstarbp 启 动 本 地 服务 


if (tstatus.erpty0) { 
free (Env) 7 
free (OM) ; 
IOW ("CreateJavaWM failed: %s", status.c str()); 
retum JNI FFR; 
} 
dmChangeStatus NULL, THREAD NATIVE); /人 改变 虚拟 机 状态 
* penv= CQNTIEnvx ) penv; 
xp_w (JavaMx ) EM 
LO ("CreateJavaWM sucoeeded"); 
retum UNI CK; // 返 回 成 功 
本 
JNI_ CreatejavaVM () 中 初始 化 虚拟 机 的 关键 部 分 是 dvmStartup ( ) 函数 ,在 
dvmStartup() 函 数 中 建立 并 初始 化 Dalvik 虚拟 机 的 各 个 组 件 , 包 括 建立 线程 管理 机 制 、 建 
立 垃圾 回收 机 制 ,建立 寄存 器 映射 ,建立 类 加 载 器 等 。 其 中 也 有 很 多 关于 JNI 机 制 的 组 件 初 
始 化 工作 。 
dvmlInlineNativeStartup() 函 数 给 虚拟 机 的 内 联 方 法 表 gDvmInlineOpsTable[ 分 配 内 
存 空间 。gDvmInlineOpsTable[ ] 内 联 函 数 表 包括 一 些 Dalvik 虚拟 机 要 使 用 的 基础 的 运算 
函数 ,比如 字符 串 比较 函数 .计算 绝对 值 函 数 、 开 平方 函数 、 三 角 函 数 计算 函数 等 。 
dvmNativeStartup() 函数 的 功能 是 建立 共享 库 的 哈 希 表 。 创 建 一 个 表 长 为 4 的 可 扩展 
哈 希 表 , 用 来 存放 本 地 调用 过 程 中 需要 用 的 动态 链接 库 。 
dvmlInternalNativeStartup() 函 数 初始 化 一 些 类 名 的 哈 希 值 ,这 些 类 是 Dalvik 虚拟 机 内 部 
的 类 ,并 提供 类 的 方法 。 首 先 , 函 数 声 明 一 个 指向 DalvikNativeClass 结构 体 的 指针 classPtr 并 
初始 化 为 gDvmNativeMethodSet。gDvmNativeMethodSet 是 一 个 DalvikNativeClass 类 型 的 数 
组 ,存放 着 这 些 虚 拟 机 内 部 的 类 。 然 后 对 gDvmNativeMethodSet 数组 中 的 每 一 个 
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开始 


获取 JavaVMInitArgs* 类 型 参数 args 


JNL EVERSION 


| 将 gDvm 的 内 存 区 域 初始 化 为 "0” 


[ 建立 虚拟 机 结构 JavaVMExt*pVM 


[以 此 提取 并 分 析 argc 中 的 参数 


调用 UseCheckedJniVM() 


ERROR: 每 个 线程 只 支持 | _ 是 
一 个 VM， 返 回 JNL_ERR 


sgDvmJnijniVm = (JavaVM*) pPVM 


为 主线 程 创 建 JNIEnv 
dvmCreateJNIEnv() 


1 


初始 化 虚拟 机 的 各 个 组 件 


status=dvmStartup() 


创建 虚拟 机 失败 ， 
返回 JNL_ERR 


!status.empty()? 


否 
改变 线程 状态 
dvmChangeStatus() 


创建 虚拟 机 成 功 


结束 
3.2 虚拟 机 创建 流程 


DalvikNativeClass 类 型 的 元 素 判断 其 classDescriptorHash 成 员 是 否 为 空 ,如 果 不 为 空 ,那么 就 调 
用 dvmComputeUtf8Hash() 函 数 计算 哈 希 值 并 赋值 给 classDescriptorHash 成 员 ,完成 初始 化 工作 。 

dvmjniStartupO 〇 函数 初始 化 本 地 调用 机 制 的 引用 表 。 函 数 首 先 执行 gDvm. jniGlobalRef Table. 
init(kGlobalRefsTableImitialSize , kGlobalRefsTableMaxSize , kIndirectKindGlobal) ,将 Dalvik 虚拟 机 全 
局 变量 gDvm 的 jniGlobalRefTable 初始 化 .传人 的 三 个 参数 均 为 系统 定义 的 ， 
kGlobalRefsTablelInitialSize 是 Global Reference Table 的 初始 大 小 ,为 512; kGlobalRefsTableMaxSize 
为 Global Reference Table 的 最 大 值 .为 51200, 这 个 值 是 任意 定义 的 ,只 要 小 于 64K 即 可 ; 
kIndirectKindGlobal 是 Indirect reference 种 类 .定义 如 下 。 
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kIndirectkindInvalid =0， // 间 接 引 用 非法 
kIndirectKingrocal CO // 间 接 引 用 是 局 部 引用 
kIndirectKingsldoal 二 加 // 间 接 引 用 是 全 局 引用 
kIndirectKinWeakGlobal= 3 // 间 接 引 用 是 弱 全 局 引用 


这 个 枚 举 类 型 和 jni. bh 文件 中 的 jobjectRefType 是 相 匹 配 的 。 初 始 化 后 ,就 为 全 局 引用 表 
jniGlobalRefTable 分 配 了 内 存 空 间 。 然 后 , 执行 gDvm. jniWeakGlobalRefTable. init 
(kWeakGlobalRefsTableInitialSize , kGlobalRefsTableMaxSize , kIndirectKindWeakGlobal) , 原理 
类 似 , 将 gDvm 的 jniWeakGlobalRefTable 初始 化 ,传人 的 kWeakGlobalRefsTableInitialSize 参数 
为 16，kGlobalRefsTableMaxSize 参数 为 51200, kIndirectKindWeakGlobal 是 枚 举 类 型 
IndirectRefKind 的 一 个 成 员 , 值 为 3。 

dvmPreMainForJni() 函 数 完成 线程 结构 体 的 一 些 初 始 化 工作 ,这 些 初始 化 工作 用 以 支 
持 本 地 调用 机 制 。 函 数 首 先 获得 系统 的 主线 程 ,主线 程 通常 位 于 线程 列表 的 第 一 个 。 然 后 
调用 createFakeEntryFrame() 函 数 在 主线 程 解释 栈 的 顶端 创建 一 个 “fake”JNI 帧 。 栈 的 顶 
端 在 内 存 的 低地 址 处 , 栈 的 底 端 在 内 存 的 高 地 址 处 ,简单 地 说 就 是 栈 向 下 生长 。 然 后 调用 
dvmSetJniEnvThread1d() 函 数 设置 envThreadId, 之 后 调用 dvmSetThreadJNIEnv() 函 数 设 
置 JNIEnv 域 。 

registerSystemNatives() 函 数 注册 Android 系统 的 内 部 本 地 方法 。 首 先 函 数 获取 到 系 
统 的 主线 程 指针 ,同样 位 于 线程 表 的 第 一 个 。 然 后 执行 self 一 status 一 THREAD _ 
NATIVE, 将 线程 的 状态 切换 至 THREAD_NATIVE, 这 个 操作 是 必需 的 ,必须 在 允许 基 
JNI 的 方法 注册 之 前 设置 此 线程 状态 。 然 后 执行 jniRegisterSystemMethods() 函数 注册 系 
统 本 地 方法 ,在 jniRegisterSystemMethods() 函 数 中 又 分 别 调用 registerCoreLibrariesJni() 
函数 和 registerJniHelp() 函 数 执行 针对 于 具体 类 和 方法 的 注册 操作 。 

以 上 是 和 本 地 调用 机 制 直接 相关 的 初始 化 工作 ,执行 完 系统 组 件 的 各 个 初始 化 工作 之 
后 ,Dalvik 虚拟 机 就 算 建立 起 来 了 。 


3.4 Java 调用 C 执行 流程 分 析 


3.4.1 解释 器 栈 帧 结构 体 


解释 器 作为 Dalvik 虚拟 机 的 执行 引擎 在 Dalvik 虚拟 机 的 执行 流程 中 扮演 着 非常 重要 
的 角色 ,而 为 了 分 析 函 数 的 执行 顺序 和 流程 ,必须 对 解释 器 栈 有 一 个 深刻 的 理解 。 如 图 3. 3 
所 示 为 解释 器 栈 的 结构 简 图 。 

Android 系统 的 Dalvik 虚拟 机 在 执行 Android 应 用 程序 时 ,每 一 个 线程 都 维护 着 一 个 
虚拟 的 解释 器 方法 栈 。 栈 的 栈 顶 在 低地 址 , 栈 底 在 高 地 址 , 栈 是 向 下 生长 的 。Dalvik 虚拟 
机 的 解释 器 要 在 执行 方法 前 将 栈 帧 压 人 解释 器 栈 中 。 栈 帧 结构 体 Struct StackSaveArea 的 
定义 如 表 3. 5 所 示 。 


nn 
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高 地 址 三 ] 


Break frame 


Registerx4 


sel 全 >interpSave.curFrame 
Regular frame 


低地 址 


3.3 解释 器 栈 简 图 


表 3.5 栈 帧 结构 体 成 员 变 量 


成 员 变量 类 型 变量 说 明 
prevFrame u4 7 保存 指向 前 一 个 栈 帧 ,如 果 在 栈 底 ,那么 为 空 
savedPc const u2 保存 的 程序 计数 器 
method; const Method 保存 当前 执行 的 方法 指针 
localRefCookie u4 对 于 JNI 本 地 方法 : 局 部 引用 段 的 底部 
currentPe const u2 对 于 解释 方法 : 保存 当前 的 PC, 为 了 异常 栈 追 踪 和 调试 跟踪 
returnAddr const u2” JIT 本 地 返回 指针 ,如 果 为 0 是 解释 方法 


代码 清单 3.9 dalvik/vm/interp/Stack. h: StackSaveArea 结构 体 定义 


Struct StackSaveArea { 


ud* prevErame; 

Const u2* SavedPc; 

const Method*x method; 

union { 
ud localRefCookie; 
Const 2* CurrentPc; 

} xtra; 


Bs 


结构 体 包括 5 个 成 员 变 量 , 每 个 成 员 变 量 占 4B, 整 个 栈 帧 占有 20B 的 空间 。 调 用 一 个 
方法 时 要 压 人 两 个 栈 帧 ,其 中 第 一 个 栈 帧 叫做 break frame, 它 的 method 字段 为 NULL， 
break frame 栈 帧 的 作用 是 处 理 方法 的 返回 和 异常 发 生 的 情况 。 第 二 个 栈 帧 就 是 方法 本 身 
的 栈 帧 了 ,可 以 称 之 为 regular frame, 在 regular frame 栈 帧 的 前 部 会 分 配 占 registersX4 大 
小 的 内 存 空间 ,registers 是 方法 的 寄存 器 数量 ,一 个 寄存 器 是 32 位 ,占有 4B。 这 部 分 内 存 
空间 用 来 保存 方法 的 参数 和 局 部 变量 。Dalvik 虚拟 机 解释 器 可 以 通过 查看 栈 帧 的 method 
成 员 是 否 为 NULL 来 区 分 这 两 个 栈 帧 。 

点 拨 Dalvik 虚拟 机 解释 器 在 函数 执行 前 调用 dvmPushInterpFrame 函数 来 进行 压 栈 
操作 ,使 栈 指 针 向 低地 址 方向 移动 , 当 解 释 器 执行 完 函 数 时 ,调用 dvmPopFrame 函数 将 栈 
帧 弹出 , 栈 指针 向 高 地 址 方向 移动 。 


第 3 章 JNI 模 块 的 原理 及 实现 


3.4.2 关键 函数 
1. JNI_CreateJavaVM 函数 


JNI_ CreateJavaVM(JavaVM* * p_vm, JNIEnv * * p_env, void * vm_args) 在 dalvik/vm/ 
Jni. cpp 中 定义 , 源 代码 如 下 所 示 ,函数 流程 图 如 图 3.4 所 示 。 


分 配 JavaVMExt 并 初始 化 


将 args 转 化 为 argv 


1 
为 主线 程 创建 JNIEnv 


了 
启动 虚拟 机 dvmStartup 


改变 状态 为 THREAD_NATIVEdvmChangeStatus 


图 3.4 JNI CreatejJavaVM() 函 数 流程 图 


代码 清单 3.10 dalvik/vmy/Jni. cpp: JNI_CreateJavaVM() 源 代码 


jint JNI CreateJavavM(UavaVM* * p VmJNIEnvx * p env,void* vm args) { 
const JavaWMInitArgs* args= (Java\MInitArgs* ) wm args; 
/x 检查 version 是 否 大 于 等 于 JNI VERSION 1 2* / 
if (args- > version< JNI VERSION 1 2) { 
retum JNI_ FVERSION; 
} 
tx 初始 化 gpmx* / 
memset (xzgDvm, 0, sizeof (gDvum ) 7 
JavaMExt * BME (JavaVMEzt* ) malloc (sizeof (JavaVMExt))7 
Ax 初 始 化 JavavMExtx / 
memset (BWM, 0, sizeof (JavaVMEzt))7 
BWM- > funcTable= sgInvokeInterfacey 
EBM- > ervList= NULL; 
dymInitMitex (gM- > ervListIock) ; 


UniquePtr< const har * []> argv (new const har* [args- > noptions]); 
memset (argv.get () ,0, sizeof (har* ) * (args- >rnoptions)); 
x 处理 参 数 中 的 noptions* / 
int argc=07 
for (int i=0; i<args->noptions; 计 +) { // 检 查 每 一 个 参数 选项 
const har* cptStr= args- > captions[i] .cptionstring; 
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if (optstr==NULD) { 

GrEprintf (stoderr, "ERROR: CreateJavaWM failed: argument $d was NULI\n",i); 

retum JNI FFR; 
} else if (stramp(optStr, "vfprintf")==0) { 

gpvm.vfprintfHook= (int (* ) (FILE * ,Const har* ,va list))args- > cptions[i] .extraInfo; 
} else if (stram (optStr "exit")==0) { 

gpm.exitHook= (void (* ) (int)) args- > options[i] .extraInfo; 
} else if (stram (optStr, "abort")==0) { 

gpm.abortHook= (void (* ) (void))args- > options[i] .extraInfo; 
} else if (stram (optStr, "sensitiveThread")==0) { 

gpm.issensitiveThreadHook= (bool (* ) (void))args- > options[i] .extraInfo; 
} else if (stram (optStr,"- xcheck:jni")==0) { 

gpvmni.usecheckJni= true; 
} else if (stmam (optStr,"- xjniopts:",10)==0) { 

har* jniopts= strdup (optStr +10); 

size t jnioptcount= 1; 

for (har* p=jniopts; *p (=0; ++p) { 

1 
++]jnioptcount; 
< PFO7 


} 
Char* jniopt= jniopts; 
for (size t j=0; i<jnioptcount; ++i) { ”// 检 查 每 一 个 参数 选项 
if (stram (jniopt, wamonly")==0) { 
gbvumni.wamonly= true; 
} else if (stramp (jniopt, "forosoopy")==0) { 
gpmni .foroeCopy= true; 
} else if (stram (jniopt, "JogThirdpartyJni")==0) { 
gpmni .logThirdPartyJni= true; 
} else { 
dnEprintf (stderr, "FRRCR: CreateJavaM failed: nmom -区 niqpts apticn !%snw 
jnioptb); 
retum JNI ERR7 
} 
jniQpt += strlen (jniApt) +1; 
. 
free niopts) 7 
} else { 
/< Tegular caption */ 
argv[argc++ ]= cptStr; 


if (gpmhi.useCheckIni) { // 如 果 使 用 Checkoni 


if (gpmhni.jniVn !=NULL) { 
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GymEprintf (stderr, "FRROR: Dalvik only supports one WM per proocess\n"); 
retum JNI FRR; 
} 
gpummni .jnivir (JavaM* ) BWM; 
Axx 创建 JNIEnvx / 
INIEnvExt * PEnv= (ONIEnvExtx ) dCreateJNIEnv (NULL); 


Ax 启 动 虚拟 机 的 各 项 服务 ， ,是 虚拟 机 建立 立 的 关键 * / 
std: :string status= 
dumStartup (argc, argv .get () ,args- > ignoreUnreoogized, (JNIEnvV * )pErV); 


if (!status.erpty()) { 


free (pErV); 
free (BWM); 
IOSW ("CreateJavaWM failed: %s", status.c str()); 
retum JNI FFR; 
} 
GmChangeStatus (NULL, THREAD NATIVE) /人 改变 状态 


* p envr CQNIEnvx ) prv; 
* p ve (JavavM# ) EWM; 
IOGV(CreateJavavM succeeded") ; 
retum JNT Ok; // 返 回 成 功 
i 
Zygote 进程 启动 后 会 调用 JNI_CreateJavaVM() 函 数 启 动 虚拟 机 来 运行 Android 程 
序 。 现 在 就 来 分 析 一 下 虚拟 机 启动 调用 的 JNL_ CreateJavaVM 的 大 致 流程 。 一 个 用 户 进 程 
只 能 创建 一 个 虚拟 机 。 首 先 函 数 创建 虚拟 机 需要 的 JavaVMExt 结构 体 ,创建 之 后 调用 
memset 函数 进行 初始 化 ,接着 调用 dvmInitMutex() 函 数 初 始 化 信号 量 。 然 后 函数 把 JNI 
的 args 转化 为 argv, 分 析 创建 虚拟 机 时 传人 的 函数 参数 ,根据 选项 设 定 相应 的 值 。 然 后 为 
主线 程 创建 一 个 JNIEnv ,做 一 些 初始 化 的 动作 ,需要 调用 本 地 代码 。 然 后 调用 dvmStartup 
来 初始 化 各 个 功能 ,其 中 包括 启动 垃圾 回收 .启动 线程 .启动 内 联 本 地 方法 .启动 类 ,启动 
JNI,\ 初 始 化 类 等 。 在 各 种 虚拟 机 的 功能 模块 启动 ,初始 化 之 后 ,虚拟 机 就 算是 启动 完成 ,可 
以 运行 Android 程序 了 。 然 后 调用 dvmChangeStatus 函数 改变 线程 当前 状态 为 THREAD_ 
NATIVE ,打印 出 “CreateJavaVM succeeded” 信 息 , 并 返回 JNLOK。 


2. dvmCallJNIMethod 函数 


dvmCallJNIMethod 在 dalvik/vm/Jni. cpp 中 定义 , 源 代 码 如 下 所 示 , 函数 流程 图 如 
图 3.5 所 示 。 
代码 清单 3. 11 dalvik/vm/Jni. cpp: dvmCallJNILMethod() 源 代码 


Void dwmCal 1JNIMethod (const u4* args,JValue* FEesult,const Method* method,Threadx self) { 
UuU4x mdArgs= (04< ) args; 


| 


Ra 


jclass statidMethodclass= NULL; 


U4 aocessF1ags=rethpd- > accessF1ags7 
/赋值 accessF1ags 
bool isSynchronjzed= (accessF1ags & RMOC_SYNCHRONTZFED) ! 


int idx= 0; 
Cbject* lockCbj; 
Ax 检 查 被 调用 的 函数 是 否 为 静态 的 x* / 
证 ((accessF1ags & ROC STATIC) !=0) { 
lockcbj= (bject* ) method- > clazz; 
StaticMethodclass= (jclass) addLocalReferenoe (self, 
(Object* ) method- > clazz); 
} else { 
lockobj= (Cbject * ) args[0]; 
/x* add "this" */ 
modArgs [idx+ + ]= (u4) addrocalReferenoe (self, (Cbject 
* ) modArgs[0]); 
} 


证 (Imethod- >ncRef) { 
const har* shorty= gmethod- > shorty[1]; 
/x 处 理 被 调用 函数 的 各 个 属性 * / 
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开始 
1 
根据 参数 创建 局 部 引用 


1 
改变 线程 状态 为 THREAD_NATIVE 
dvmChangeStatus 
! 
调用 相应 方法 


dvmPlatformInvoke 


i 
改变 线程 状态 为 上 一 个 状态 | 


hme 


有 


convertReferenceResult 


结束 


图 3.5 dvmCallJNIMethod() 流 程 图 


while (* shorty = "\0') { // 循 环 检查 方法 的 shorty 字 段 


Switch (x shorty++) { 
Case LD': 


/IOGT (" local %d: Ox%08x", idx,modArgs [idx]); 


if (mdArgs[idz] !=0) { 


modArgs [idx]= (u4) addLocalReference (self, (Qoject * ) modArgs[idx]); 


Case 'J': 
igxt +; 
break; 
default: 
/x ZBCSI--donothing * 


idxt+; 


if (UNLIKETY (method- > shouldrrace)) { 
JogNativeMethoqPmntry (method, args) ; 

} 

if (UNLIKETY (isSyndhronized)) { 
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dm ockObject (self, 1ockObj); 
} 
ThreadStatus olgstatus= dvmchangeStatus (self, THREAD NATIVE); /人 改变 状态 
RNDROID MEMBAR FULL(); 
assert (method- > insns ‘=NULD); 
JUNIEnvx* em self- > jniEnv; 
COMPUTE, STACK SUM(self); // 计 算 本 总数 
Ax 调 用 函数 x* / 
dmPlatfomInvoke (env, 
(Classcbject* ) statidvethodclassy 
method- > jniArgInfo, method- > insSize,modArgs,method- > shorty, 


(void* ) method- > insns,pResult); // 调 用 函数 
CHECK STACK SUM(self); 
dvmchangeStatus (self,oldstatus) ; // 改 变 线 程 状态 


convertReferenosResult (env,PResult,method, self); 

if (UNLIKELY (isSynhronized)) { 
dwrDnlockcbject (self, lockGoj) 7 

} 

if (UNLIKELY (method- > shouldTrrace)) { 
logNativeMethodExdit (method, self, * pResult); 


} 


本 函数 首先 遍历 参数 列表 ,创建 合适 的 局 部 参数 引用 ,并 添加 到 引用 列表 中 。 调 用 
dvmChangeStatus() 函数 改变 线程 状态 为 THREAD_NATIVE 。 然 后 调用 dvmPlatformInvoke() 
函数 根据 参数 调用 本 地 函数 ,与 底层 进行 交互 。 然 后 调用 dvmChangeStatus() 函数 将 线程 状态 
改 为 oldStatus, 也 就 是 说 改 为 上 一 个 状态 。 接 着 调用 convertReferenceResult() 函 数 , 将 引用 结 
果 进 行 转化 ,从 局 部 引用 或 者 全 局 引用 转化 为 对 象 指针 。 到 这 里 ,调用 JNI 函数 就 完成 了 。 


3. 函数 dvmResolveNativeMethod 


dvmResolveNativeMethod 在 dalvik/vm/Native. cpp 中 定义 , 源 代 码 如 代码 清单 3. 12 


所 示 ,函数 流程 图 如 图 3.6 所 示 。 
代码 清单 3. 12 dalvik/vm/Native. cpp: dvmResolveNativeMethod() 源 代码 


void dResolveNativeMethod (const u4x argsyJValuex pResult, 
const Methodx method,Thread* self) 
Classcbject* clazz=method- > clazz; 
tx 是 否 为 静态 方法 * / 
if (dvmIsStatidMethod (methogd)) { 
if (!dwmIsClassInitialized (clazz) && !dwmInitClass (clazz)) { 
assert (dnCheckExosption (dnlIhreadSelf ())); 
retum; 
} 
} else { 
assert (dwmIsClassInitialized (clazz) || 
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GumIsClassInitializing (clazz)); 
} 
A* 在 内 部 本 地 方法 中 查找 要 被 调用 的 函数 x* / 
DalvikNativeFunc infunc= dmLookupIntemalNativeMethod (method) ; 
Ax* 如 果 找 到 将 被 调用 的 函数 * / 
if (infimc !=NOLD) { 
下 IOGVV( { 
Char* desc= dexProtoCopyMethodDescriptor (gmethod- > Prototype)7 
IOGVV("+++ resolved native %5s.%s $5,invoking", 
clazz- > descriptor,method- > name, desc); 
free (desc); 
} 
if (dwmIsSynchronizedvethod (method)) { 
LOGE ("FRROR: intemal- native can't be declared 'syndhronized'"); 
IOGE ("Failing on $5.%s",method- > Clazz- > descriptor,method- > name); 
GymAbort ()7 // harsh,but this is VM intemal problem 
} 
DalvikBridgeFunc dfunc= (DalvikBridgeFunc) infunc; 
Ax 设 置 Method 结 构 体 的 相应 参数 * / 
GvmSetNativeFunc ( Method* ) method,dfinc, NOLD); 
Ax 调 用 隐 数 x* / 
dfunc (args,pResult,method, self); 
retum; 
} 
Ax 如 果 没 有 在 内 部 本 地 函数 中 找到 ,那么 在 共享 库 中 查找 * / 
void* finc= lookupsharedLibMethod method) 
Ax# 如 果 查 找到 * / 
if (func !=NULD) { 
As# 使 用 NT 调用 桥 * / 
dmUseJNIBridge ( Method* ) method, func); 
Ax 跳 转 到 被 调用 的 函数 x / 
(* method- > nativepunc) (args,pResult,method, self); 
retum; 


IF IOGW( { 
har* desc= dexProtocopyMethodDescriptor (gmethod- >prototype); 
IOW ("No implementaticn found for native $5.%s $s", 

clazz- > descriptor,method- > name, Gesc); 

free (Gesc); 

} 

dmIhrowUnsatisfiedLinkError method- > name); 

} 


本 函数 的 作用 是 找到 一 个 本 地 函数 然后 调用 它 。 聘 数 最 开始 获取 方法 的 类 method 一 


clazz, 然 后 调用 dvmlsStaticMehod() 函 数 判 断 当 前 的 方法 是 否 为 静态 方法 ,静态 方法 应 该 在 类 
初始 化 之 前 被 调用 ,如 果 是 静态 方法 就 检查 类 是 否 被 初始 化 ,如 果 没 有 被 初始 化 ,就 初始 化 这 


第 3 章 JNI 模 块 的 原理 及 实现 


开始 
了 
获取 当前 方 的 类 clazz 


判断 方法 是 否 为 静态 方法 是 初始 化 类 


dvmlsStaticMethod? dvmlnitClass 


D2 


查找 内 部 本 地 方法 
dvmLookupInternalNativeMethd 


否 


判断 infunc 是 否 为 空 7 dexProtoCopyMethodDescriptor 
1 是 将 infunc 转 化 为 
在 共享 库 中 查找 方法 DalvikBridgeFunc 类 型 dfunc 


lookupSharedLibMethod 


将 method->nativeFunc 和 
method->insns 替 换 为 新 值 
是 一 有 Wifunc 是 否 T 
为 空 ? 


~ RR 
抛 出 异常 并 返回 全 
dvmThrowUnsatisfiedLinkError 1 
返回 
调用 方法 并 返回 


dvmUseJNIBridge 
(*method->nativeFunc) 


3.6 ”dvmResolveNativeMethod() 函数 流程 图 


个 类 ,然后 返回 。 如 果 不 是 静态 方法 ,程序 继续 执行 ,调用 dvmLookupInternalNativeMethod 函 
数 在 内 部 本 地 方法 列表 中 寻找 这 个 方法 ,如 果 结 果 不 为 空 ,说明 这 个 方法 是 虚拟 机 内 部 的 本 地 
方法 ,并 且 如 果 这 个 方法 不 是 同步 的 方法 ,那么 就 调用 dvmSetNativeFunc() 函 数 将 method 一 
nativeFunc 和 method>insns 替换 成 新 的 值 。 然 后 调用 这 个 本 地 方法 ,之 后 返回 ,完成 对 这 个 
方法 的 处 理 。 如 果 在 虚拟 机 内 部 本 地 方法 中 没有 找到 这 个 方法 ,那么 就 在 共享 库 中 寻找 这 个 
本 地 方法 ,调用 lookupSharedLibMethodQO) 函数 。 如 果 找 到 本 地 方法 ,那么 调用 
dvmUseJNIBridge() 函 数 使 用 JNI Bridge, 然 后 调用 这 个 方法 ,完成 对 方法 的 处 理 。 但 是 如 果 没 
有 找到 这 个 方法 ,就 调用 dvrmThrowUnsatisfiedLinkError() 函 数 抛 出 异常 ,程序 到 此 结束 。 


3.4.3 Java 调用 C 执行 流程 


分 析 Dalvik 虚拟 机 执行 本 地 函数 (以 C 函数 为 例 ) 的 流程 时 ,采用 静态 分 析 源 代码 函数 
的 内 部 实现 的 同时 还 要 配合 Linux 系统 下 的 GDB 动态 调试 跟踪 工具 来 获得 函数 的 调用 情 
况 和 堆栈 信息 。 

Dalvik 虚拟 机 在 加 载 完 类 之 后 ,执行 类 的 main 函数 ,首先 会 调用 JNI 本 地 函数 接口 
GetStaticMethodID(JNIEnv * env, jclass jclazz, const char * name, const charx sig) 来 获得 主 
函数 main 的 MethodID, 然 后 调用 JNI 接口 函数 CallStaticVoidMethod(jclass clazz, jmethodID 
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methodID,…) 来 调用 主 函 数 。 最 后 调用 Stack. cpp 文件 中 的 dvmCallMethodV (Thread * self， 
const Method * method，Object * obj, bool fromJni, JValue* pResult,va_list args) 函数 完成 
具体 的 函数 调用 功能 。dvmCallMethodV 函数 调用 callPrep 函数 ,callPrep 函数 的 主要 功能 
是 向 解释 器 栈 中 压 人 一 个 栈 帧 ,这 里 是 主 函 数 main 的 栈 帧 ,并 将 self 一 interpSave. 
curFrame 指针 向 前 移动 ,函数 返回 main 方法 的 类 对 象 。 向 解释 器 栈 中 压 人 栈 帧 是 由 
dvmPushlInterpFrame(Thread * self, const Method * method) 函数 完成 的 。 由 前 述 分 析 
可 知 , dvmPushInterpFrame 函数 需要 压 人 两 个 栈 帧 ,break frame 和 方法 本 身 的 栈 帧 
regular frame。 在 dvmPushInterpFrame 函数 中 维护 了 一 个 指针 stackPtr, 在 压 栈 过 程 中 
stackPtr 指针 指向 栈 的 栈 顶 。 开 始 时 ,判断 self-~interpSave. curFrame 是 否 为 空 ,如果 为 空 
表示 当前 方法 栈 为 空 ,stackPtr 指针 指向 self->interpStackStart, 即 解释 栈 的 起 始 位置 。 如 
果 self>interpSave. curFrame 不 为 空 , 则 stackPtr 指向 self~>interpSave. curFrame 一 1, 即 


下 一 个 栈 帧 起 始 的 位 置 。 压 栈 过 程 中 需要 的 栈 空间 总 数 如 下 式 所 示 。 


stackRed- method- > registersSize * 4 // 方 法 参数 和 局 部 变量 
+ sizeof (StacksaveArea) * 2 //break frame + regular frame 
db) phrase ok Loaded 由 于 寄存 器 为 32 位 ,所 以 保存 一 个 寄存 器 需要 4B 的 
‘gp *breakSaveBlock 内 存 空间 ,一 个 StackSaveArea 结构 体 大 小 为 20B, 总 共 为 
preverane evaldaefee， 栈 帧 分 配 40B。 接 下 来 将 栈 指针 stackPtr 向 前 移动 ,为 寄存 
ethod 0 0， 器 和 栈 帧 分 配 内 存 空 间 。 然 后 赋值 栈 帧 的 各 个 成 员 变 量 ， 
localRefcookie - 9, 初始 化 栈 帧 ,self>interpSave. curFrame 指向 方法 栈 帧 的 起 
ee 始 处 。 至 此 ,类 的 主 函 数 main 已 经 被 压 和 人 解释 器 的 方法 栈 
》 returnAddr = 6x4658e776 中 。 如 图 3.7 所 示 为 压 人 解释 器 栈 的 break frame 和 
sl *saveBlock regular frame 结构 体 的 各 个 成 员 变 量 的 内 容 。 
je ee 如 图 3.7 所 示 为 解释 器 栈 内 存 存储 情况 ,可 以 看 出 解释 
method = Qx4le5d250, 器 栈 由 高 地 址 向 低地 址 依次 存放 着 break frame 和 regular 
ercooue 。e， frame, 栈 帧 的 每 个 成 员 变量 占有 4B。 


currentPc = 6x8 


然后 会 调用 解释 器 到 入 口 函 数 dvmInterpret(Thread * 
self, const Method * method, JValue x pResult) 执行 
3.7 ” 栈 帧 结构 体 成 员 变量 ” main 方法 ,解释 器 开始 执行 main 方法 的 字 节 码 。 下 面 来 详 
细 分 析 一 下 虚拟 机 执行 本 地 函数 的 过 程 ,如 图 3. 8 所 示 ,为 

Java 代码 调用 本 地 代码 的 流程 。 

无 论 是 本 地 函数 还 是 Java 函数 .方法 的 属性 都 存储 在 Method 结构 体 中 。Method 结 
构 体 使 用 一 个 4B 整 型 变量 accessFlags 来 表示 方法 的 访问 属性 。 在 文件 androidsource/ 
dalvik/libdex/DexFile.h 中 定义 了 各 种 方法 属性 和 对 应 的 十 六 进 制 数 值 , 比如, ACC_ 
NATIVE 二 0x00000100 表示 本 地 方法 的 accessFlags 值 为 0x00000100, 也 就 是 十 进 制 的 
256。 虚 拟 机 可 以 通过 判断 accessFlags 字段 的 值 来 判断 方法 的 访问 属性 ,包括 public、 
private ,protected ,static ,final 等 。 

当 虚 拟 机 要 执行 一 个 本 地 函数 时 ,会 首先 执行 Method 一 nativeFunc。nativeFunc 是 
Method 结构 体 的 一 个 成 员 字 段 .是 一 个 DalvikBridgeFunc 类 型 的 函数 指针 ,初始 时 为 void 
dvmResolveNativeMethod (const u4 * args, JValue * pResult, const Method * method, 
Threadx self) ,Method 结构 体 的 另 一 个 字段 insns 是 一 个 2B 的 指针 ,指向 这 个 函数 的 实际 


}, 
returnAddr = 6xfffffffd 
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{gdt) x/18xw Bx41da9fac 


Bxd4]da9fgC: 8x4]1da9fd4 6x86998669 8x4le5d258 6x96696669 
6x4]da9f9c: exfffffffd 6x41da9fd4 8x69666966 6x41e288e8 
Bx4]da9fac: Bx426c8a5c Bx4leletaB 9x896866969 exTTTTTTTd 


8x4]da9fbc: ex465al8ce6 6x41da9fe8 9x69666966 6x686996669 
8x4]da9fcc: 8x69869666 8x465Be778 


3.8 解释 器 栈 内 存 情况 


代码 位 置 , 也 就 是 调用 加 载 的 动态 链接 库 中 函数 的 机 器 码 在 内 存 中 的 地 址 。 刚 开始 时 ,虚拟 
机 需要 执行 Method 一 nativeFunc, 也 就 是 androidsource/dalvik/vm/ Native. cpp 文件 中 的 
dvmResolveNativeMethod 函数 来 处 理 本 地 方法 ,处 理 的 主要 工作 就 是 查找 本 地 函数 ,然后 
调用 执行 它 。dvmResolveNativeMethod 函数 首先 调用 dvmLookupInternalNativeMethod 
函数 在 Dalvik 虚拟 机 的 内 部 本 地 方法 中 查找 这 个 本 地 函数 ,对 于 虚拟 机 的 内 部 的 类 的 本 地 
方法 ,可 以 通过 这 个 方法 找到 。 而 对 于 用 户 编写 的 应 用 程序 中 的 本 函数 来 说 ,使 用 这 个 函数 
是 找 不 到 的 ,这 就 需要 继续 执行 ,调用 lookupSharedLibMethod 函数 在 虚拟 机 的 本 地 动态 
链接 库 中 查找 函数 。 虚 拟 机 全 局 结构 体 gDvm 中 的 nativeLibs 字段 是 一 个 指向 哈 希 表 类 型 
的 指针 ,用 来 表示 虚拟 机 本 地 共享 库 表 。 对 于 nativeLibs 中 的 每 一 个 共享 库 人 口 调用 
findMethodInlib 函数 在 这 个 本 地 动态 链接 库 中 查找 本 地 函数 ,直到 找到 这 个 本 地 函数 , 返 
回 指向 它 的 指针 ,如 图 3.9 所 示 为 Java 代码 调用 本 地 代码 流程 。 

Method 结构 体 的 两 个 成 员 变 量 nativeFunc 和 insns 有 三 个 基本 状态 : 

(1) (初始 状态 )nativeFunc 王 dvmResolveNativeMethod，insns 王 NULL; 

C2 (内 部 本 地 方法 )nativeFunc 王 二 impl 二 ， insns= NULL:; 

(3) (JNDnativeFunc=JNI call bridge，insns 一 一 impl>。 

最 普遍 的 状态 转换 是 (1) 到 (2) 和 (1) 到 (3)。 如 果 调 用 dvmLookupInternalNativeMethod 函数 
查找 到 一 个 函数 是 虚拟 机 内 部 本 地 函数 ,就 调用 dvmSetNativeFunc 函数 将 这 个 本 地 函数 的 
nativeFunc 字段 设置 为 指向 这 个 本 地 函数 的 实现 代码 的 指针 ,insns 成 员 为 NULL, 也 就 是 (1) 到 
(2) 的 状态 转换 ,然后 调用 这 个 本 地 函数 。 如 果 这 个 函数 不 是 虚拟 机 内 部 本 地 函数 ,那么 调用 
lookupSharedLibMethod 函数 找到 本 地 函数 后 ,调用 dvmUseJNIBridge 函数 使 nativeFunc 指向 JNI 
Call Bridge,insns 指向 函数 的 代码 实现 位 置 ,这 就 是 (1) 到 (3) 的 状态 转换 。 如 果 gDvmjni. 
useCheckJni 为 真 ,那么 JNI call bridge 为 dvmCheckCalJNIMethod, 和 否则 为 dvmCalJNIMethod。 

对 于 用 户 应 用 程序 中 的 本 地 函数 ,虚拟 机 调用 找到 本 地 函数 后 ,调用 nativeFunc 指向 
的 JNI Call bridge, 关键 阻 数 是 dvmCallJNIMethod。dvmCallJNIMethod 函数 调用 了 
androidsource/dalvik/vm/arch/arm/CallEABI. S 文件 的 dvmPlatformInvoke 函数 来 执行 
本 地 方法 ,dvmPlatformInvoke 是 用 汇编 编写 实现 的 函数 。JNI Call bridge 可 以 说 是 解释 的 
Java 代码 和 本 地 函数 代码 之 间 的 一 个 桥梁 。 如 下 所 示 为 dvmPlatformInvoke 函数 中 从 Java 
代码 跳 转 至 本 地 代码 的 关键 语句 。 


ldmia r9, {r2- r3} @ r2/r3< — argv[0]/argv[1] 

ldr ip, [fp,#8+FP RDD] eipc- finc 

blx ip @ call finc 

将 函数 的 参数 传递 给 rz 和 r3 寄存 器 .然后 本 地 函数 的 指针 传递 给 ip 寄存 器 ,执行 blx 


跳 转 语句 ,程序 跳 转 至 ip 寄存 器 [10] 指 向 的 地 址 处 执行 , 即 跳 转 至 本 地 动态 链接 库 的 本 地 
代码 中 执行 。 


A 


28 一 。 Android Dalvik 唐 拟 机 结构 及 机 制 剖析 一 一 第 2 卷 Dalvik 虚拟 机 各 模块 机 制 分 析 


本 地 函数 是 
Resolved? 
否 


dvmLookupInternalNativeMethod() 


是 | 设置 Method 的 
一 nativeFunc 成 员 
和 和 insns 成 员 


lookupSharedLibMethod() 


抛 出 异常 找 | _ 否 
不 到 本 地 函数 
是 


设置 Method 的 nativeFunc 


成 员 和 insns 成 员 


1 


进入 本地 代码 ,执行 |_ 
本 地 函数 


Eee 


3.9 Java 代码 调用 本 地 代码 流程 


3.5 C 调用 Java 执行 流程 分 析 


3.5.1 本 地 调用 接口 函数 结构 体 


本 地 代码 通过 调用 JNI 接口 函数 来 访问 Dalvik 虚拟 机 的 特性 。 可 以 通过 使 用 一 个 接 
口 指针 来 获得 JNI 接口 函数 ,一 个 接口 指针 是 一 个 指向 指针 的 指针 。typedef const struct 
JNINativelInterface * JNIEnv 定义 了 一 个 指向 JNINativeInterface 结构 体 的 指针 JNIEnv。 
JNINativeInterface 这 个 结构 体 中 的 成 员 全 部 都 是 函数 指针 ,这 些 函 数 就 是 所 谓 的 本 地 调用 
接口 函数 , 即 JNI 函数 。 每 一 个 成 员 函 数 指针 都 指向 一 个 接口 函数 。 如 图 3. 10 所 示 为 接口 
指针 的 组 织 关 系 。 


JNI interface pointer |—» Pointer interface function 


Pointer interface function 


Wi 


Pointer interface function 


3.10 接口 指针 函数 表 结 构 


一 个 虚拟 机 可 以 提供 多 种 版 本 的 JNI 函数 接口 表 , 也 就 是 说 可 以 定义 多 个 指向 
JNINativeInterface 类 型 的 指针 变量 ,每 一 个 变量 都 是 一 个 函数 接口 表 。 例 如 ,在 Android 
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系统 的 Dalvik 虚拟 机 中 ,就 存在 以 下 两 个 版 本 的 JNI 函数 接口 表 。 

(1) 一 个 接口 函数 表 进 行 十 分 周密 的 合法 参数 检查 ,确保 函数 的 返回 值 和 参数 合法 , 适 
合 于 进行 调试 ,函数 表 的 定义 在 文件 android/dalvik/vm/CheckjJni. cpp 中 ; 

(2) 另 一 个 接口 函数 表 只 进行 最 少数 量 的 JNI 检查 工作 ,所 以 使 用 起 来 较为 高 效 ,这 个 
函数 表 定 义 在 文件 android/dalvik/vm/Jni. cpp 中 。 

另外 ,JNI 接口 函数 指针 只 在 当前 的 线程 中 有 


效 。 所 以 ,一 个 本 地 方法 不 能 够 将 一 个 接口 指针 从 一 
个 线程 传递 到 另 一 个 线程 。 本 地 函数 执行 时 ,JNI 接 将 间接 引用 转化 为 对 象 引 | 
口 指针 作为 函数 参数 传递 给 本 地 函数 ,一 个 本 地 函数 dvmDecodeIndirectRef 
可 以 被 来 自 于 不 同 Java 线程 的 函数 调用 ,所 以 它 可 一 一 一 
以 接收 不 同 的 JNI 接口 函数 指针 作为 函数 参数 。 a | 
1 
3.5.2 关键 函数 返回 JNL OK 
1. 函数 RegisterNati 
eglsterNatlves 


RegisterNatives 在 dalvik/vm/Jni. cpp 中 定义 ， 3.11 RegisterNatives() 函数 流程 图 
源 代码 如 下 所 示 ,函数 流程 图 如 图 3. 11 所 示 。 


代码 清单 3. 13 dalvik/vm/Jni. cpp: RegisterNatives() 源 代码 


static jint RegisterNatives (JNIEnv* erv,jclass jclazz,const JNINativeMethod* methods,jint rMethods) 
{ 

SccpedniThreadstate ts (env); 

Classcbject * clazz= (ClassCbject* ) dvmDecodeIndirectRef (ts.self(),jclazz); 

// 找 到 类 对 象 

if (gpm.verboseni) { 

IOGI (" [Registering JNI native methods for class %s]", 
clazz- > descriptor); 
} 


for (int i=0; i<rMethods; i++) { // 循 环 注 册 每 一 个 本 地 方法 

if (!durRegisterJNIMethod (clazz,methods [i] .name, 

methods [i] .signatire, methods [i] .fnPtr)) // 注 册 本 地 方法 
{ 
retum JNI FRR; 

} 
} 
retum JNI Ok; // 返 回 成 功 


} 


RegisterNatives() 函 数 是 JNI 机 制 中 实现 的 重要 函数 ,负责 实现 注册 本 地 函数 的 功能 。 
函数 体 首先 调用 dvmDecodeIndirectRef() 函数 对 间接 引用 进行 转化 ,转化 为 类 对 象 clazz， 
然后 在 for 循环 中 对 methods 本 地 方法 数组 中 的 每 一 个 本 地 方法 进行 注册 ,调用 函数 
dvmRegisterJNIMethod() ,函数 参数 为 方法 的 名 字 、 签 名 和 函数 指针 ,如 果 注 册 失 败 , 函 数 
返回 JNI_ERR ,和 否则 注册 成 功 ,返回 JNI_OK。 


ES 
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2. 函数 dvmRegisterJNIMethod 


dvmRegisterJNIMethod 在 dalvik/vm/Jni. cpp 中 定义 , 源 代码 如 下 所 示 ,函数 流程 图 如 
图 3.12 所 示 。 


fastJni = true 
寻找 direct 方 法 | 
dvmFindDirectMethodByDescriptor Snature 


RS 是 寻找 Virtual 方 法 
method 是 否 为 空 ? dvmFindVirtual MethodByDescriptor 


是 否 为 本 地 方法 
dvmIsNativeMethod? 


method 是 否 为 空 7 


否 慢 
返回 false 
处 理 本 地 方法 


dvmResolveNativeMethod 


使 用 JNI Bridge 
dvmUseJNIBridge 


结束 
3. 12 ”dymRegisterJNIMethod( ) 函数 流程 图 


代码 清单 3. 14 dalvik/vm/Jni. cpp: dvmRegisterJNIMethod() 源 代码 
static bool drRegisterJNIMethod (ClassCbject * clazz, const char * methodName, const char * signature, 
voidx fnPtr) 
{ 
retum false; 


bool fasthni= false; 
hx 处理 函 数 签名 x* / 
if (* sighnature=="!"') { 
fast hi= true; 
++ signature; 
IOGV("fast JNI method $s.$s:%s detected", clazz- > descriptor,methodName, signature) ; 
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Ax 根 据 签 名 查找 direct 方 法 */ 
MEthodx method- dvwmiFindDirectMethodByDescriptor (clazz,methodName,signature); 
A*#x 如 果 没 有 找到 ,那么 根据 签名 查找 Virtual* / 
if (method==NULL) { 
method= drFindVirtualMethodByDescriptor (clazz,methodName, signature); 
} 
Ax* 如 果 没 有 找到 ,返回 错误 信息 * / 
if (method==NULL) { 
dumpcandidateMethods (clazz, methodName, signature) ; 
retum false; 
} 
As#x 如 果 不 是 本 地 方法 ,不 能 注册 ,打印 错误 信息 * / 
if (!dmIsNativeMethod (method)) { 
IOW ("Unable to register: not native: $5.%5:%s", clazz— > descriptor,methodNare, sighatire); 
retum false; 
} 


if (fastJni) { 
if (dwmIsSynchronizedMethod (method)) { 
LOGE ("fast JNI method %s.%s:%S cannot be syndhronized", 
clazz- > descriptor,methodName, signature); 
retum false; 


} 
Ax 如 果 不 是 静态 方法 ,打印 错误 信息 * / 
if (!dwmIsStatiMethod (method)) { 
IOGE ("fast JNI method %s.%s:%S cannot be non- static", 
clazz- > descriptor,methodName, signature); 
retum false; 
} 
} 
tx 处 理 本 地 方法 * / 
if (method- >nativeFunc != dwrResolveNativeMethod) { 
IOGV("Note: $s.%s:%s was already registered", clazz- > descriptor,methodName, signature); 
} 


method- > fast Jni= fastJni; 
Ax 使 用 ZI 桥 */ 
dmUseJNIBridge (method, fnptr) ; 


LOW ("JNI- registered $5.%5:%s",clazz— > descriptor,methodName, signature); 
retum true; 
§ 


函数 的 参数 为 ClassObject * clazz,const char* methodName,const charx signature， 
voidx fnPtr。 首 先 判 断 fnPtr 是 否 为 空 ,如 果 为 空 , 则 返回 false。 然 后 判断 函数 的 签名 的 
第 一 位 是 否 为 *1”, 若 为 “1”, 表 示 本 地 代码 不 需要 额外 的 JNI 参数 。 然 后 方法 列表 中 按照 方 
法 描述 符 寻 找 direct 方法 ,车 找到 则 在 方法 列表 中 查找 virtual 方法 ,车 没有 找到 则 返回 
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false。 查 找到 方法 之 后 ,调用 dvmIsNativeMethod 检查 方法 是 否 为 本 地 方法 , 若 不 是 本 地 
方法 则 打印 信息 并 返回 false。 若 为 本 地 方法 则 对 方法 进行 处 理 , 注 册 。 接 着 调用 
dvmUseJNIBridge() 函 数 , 注 册 成 功 后 返回 true。 


3. 函数 dvmLoadNativeCode 


dvmLoadNativeCode 在 dalvik/vm/Native. cpp 中 定义 , 源 代码 如 下 所 示 , 函数 流程 图 
如 图 3. 13 所 示 。 


开始 


对 库 的 pathName 进 行 比较 识别 


库 是 否 已 经 加 载 过 
findSharedLibEntry? 


是 _- | 输出 信息 并 和 返回 


获取 当前 线程 

dvmThreadSelf 
1 
改变 线程 状态 为 THREAD_VMWAIT 

dvmChangeStatus 
打开 库 
dlopen 
1 
改变 线程 状态 为 上 一 个 状态 
dvmChangeStatus 


了 
创建 一 个 新 的 库 入 口 
1 


把 这 个 库 加 入 列表 
addSharedLibEntry 


3.13 dvmLoadNativeCode( ) 函数 流程 图 
代码 清单 3. 15 dalvik/vm/Native. cpp: dvmLoadNativeCode() 源 代码 


bool dmLoadNativeCode (const char* PathName,Cbject* classLoader,charx * detail) 
{ 

SharedLib* pentry; 

voidx handle; 

bool verbose; 


verbose= ! !stmamp (pathName, "/system", sizeof ("/system")— 1); // 检 查 路 径 
Verbose= verbose && !!stmarp (pathName, "/vendor", sizeof ("/vengor")— 1); 
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if (verbose) 
IOGD("Trying to load lib ss %p",pathName, classLoader); 


* Getail= NULL; 
sx 查找 共享 库 的 人 口 * / 
FEntry findsharedribentry (pathName) ; 
if Entry (=NULL) { 
if (Entry- > classIoaqder != classLoader) { 
IOW ("Shared lib '%s' already cpened by CL %p; can't open in %p", 
pathName, pEntry- > classIoader,classLoader); 
retum false; 
和 
证 (werbose) { 
IOGD ("Shared lib '%s' already loaded in same CL sp 
PathName,classLoader) ; 
于 
if (!GheckonIoadResult (Entry)) 
retum false; 
retum true; 
} 
Ax 获 取 当 前 的 线程 * / 
Thread* self= dnlIhreadSelf (); 
ThreadStatus oldstatus= dmChangeStatus (self, THREAD WAIT); 
handle= dlopen (pathName, RILD IAZY); 
sx 改变 线程 状态 * / 
GnChangeStatus (self, oldstatus); 


if (handle==NULL) { 
x* detail= strdup (dlerror ()); 
retum false; 


SharedLib* pNewEntry; 

tx 分 配 共 享 库 的 内 存 空 间 ,并 初始 化 结构 体 的 成 员 变 量 * / 
FNewEntry= (SharedLib* ) calloc(l,sizeof (SharedLib)); 
ENewEntry- > pathName= strdup (pathName); 
FNewEntry- > handle= handle; 
FNewEntry- > classLoader= classLoader; 
GymInitMitex (grNewEntry— > onLoadLock) ; 
pthread cond init (SENewEmntry- > onLoadcond,NULD) ; 
ENewEntry- > onLoadThreadId= self- > threadId; 

Ax 添 加 共享 库 的 人口 * / 
SharedLib* pActualEntry= addsharedLibentry (NewEntry); 


if (crNewEntry !=pActualEntry) { 
IOGT (WOW: we lost a race to add a shared lib (%s CI=%p)", 


PathName, classLoader) ; 
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/sx 释放 共享 库 内 存 资源 * / 
freeSharedLibentry (NewEntry) ; 
retum heckonLoadResult (pActualEntry); 
} else { 
if (verbose) 
IOGD (Gaed shared lib $s %p"pathNamevclassIoader)7 


bool result true; // 结 果 为 真 
void* vonLoad; 


int version; 


vonLoad= dlsym (handle, "JNI Load"); 
if (vonLoad==NULL) { 
IOGD ("No JNI OnLoad found in %s %p, skipping init", 
PathName, classLoager); 
} else { 
OnLoadFunc fmc= (OnLoadFunc)vonLoad; 
Object * prevoverride= self- > classIoaderoverride; 


self- > classIoaderOverride= classLoader; 
olgstatus= dvmchangeStatus (self, THREAD NATIVE); /人 改变 线程 状态 
证 (gDwmverboseJni) { 
IOGT ("[Calling JNT Load for \"%s\"]",pathName); 
h 
Versionr (* func) (goumini .jniVin, NOLD); 
dumchangeStatus (self, olgstatus); /改变 线程 状态 
self- > classIoaderoverride= prevoverride; 


if (version !=JNI VERSICN 1 2 & version !=JNI VERSION 1 4 && 
version !=JNI VERSION 1 6) // 检 查 ONT 版 本 号 


IOGW("ONI_ OnLoad retumed bad version (%d) in ss %p", 
version,pathName, classLoader); 
result= false; 
} else { 
if (gpm.verboseni) { 
IOGT(" [Retumed fram JNI_ OLoad for \"Ss\"]",pathName); 


第 3 章 JNI 模 块 的 原理 及 实现 


dmiLockMitex (SpNewEntry— > onLoadr ock) ; // 锁 住 信号 量 
pthread cond broadcast (gpNewEntry- > onIoadcong) ; 

dmUnlockMatex (SpNewEntry— > onLoadr ock) ; // 解 锁 信 号 量 
retum result; 


} 


本 函数 功能 是 加 载 指 定 绝 对 路 径 的 本 地 代码 。 如 果 已 经 加 载 过 这 个 库 , 程 序 不 执行 任 
何 操作 直接 返回 。 首 先 程序 通过 字符 串 比 较 识 别 路 径 pathName, 然 后 在 已 知 哈 希 表 中 查 
找 当前 库 ,看 是 否 已 经 加 载 过 ,如 果 加 载 过 则 直接 返回 ,和 否则 就 会 执行 程序 以 加 载 共享 库 。 
首先 调用 dvmThreadSelf() 获 得 当前 线程 ,然后 改变 线程 状态 为 THREAD_VMWAIT, 然 
后 调用 dlopen() 函 数 打 开 这 个 动态 链接 库 ,再 把 线程 状态 改 为 上 一 个 线程 状态 。 然 后 声明 
一 个 SharedLIb* 类 型 的 共享 库 人 口 ,然后 将 当前 的 库 的 信息 赋值 给 它 , 创 建 一 个 信息 共享 
库 入 口 。 然 后 调用 addSharedLibEntry() 函 数 把 这 个 人口 添加 到 共享 库 列表 中 ,到 这 里 程 
序 就 将 新 的 共享 库 加 载 到 虚拟 机 中 了 ,以 供 其 他 程序 调用 共享 库 中 的 本 地 函数 。 


3.5.3 C 调 用 Java 执行 流程 


上 述 为 Java 代码 调用 C 代码 的 流程 ,在 Java 函数 调用 执行 C 函数 的 过 程 中 ,本 地 调用 机 
制 保 证 C 函数 可 以 调用 Java 函数 。 此 时 ,C 函数 使 用 了 Java 类 的 资源 。C 函数 方法 Java 类 中 
的 资源 需要 借助 JNI 本 地 调用 接口 函数 来 完成 ,例如 ,车 要 访问 Java 类 的 变量 ,在 C 函数 中 需 
首先 调用 JNI 接口 函数 GetFieldID 或 GetStaticFieldID( 静 态 变量 ) 来 获得 变量 的 FieldID, 然 后 
调用 JNI 接 口 函 数 GetTypeField 并 传人 FieldID 参数 来 获得 具体 的 变量 ,其 中 “Type ”为 变量 的 
类 型 ,可 以 是 Int、Long、Double 等 类 型 ; 若 要 访问 Java 类 的 函数 ,首先 调用 JNI 接口 函数 
GetMethodID 或 者 GetStaticMethodID( 静 态 方 法 ) 来 获取 函数 的 MethodID, 然 后 调用 JNI 接口 
函数 CallTypeMethod 并 传人 MethodID 参数 来 调用 。 

Java 函数 由 解释 器 执行 。 解 释 器 执行 完 Java 函数 后 返回 至 本 地 动态 链接 库 继续 执行 
本 地 函数 ,如 图 3. 14 所 示 为 本 地 代码 调用 Java 代码 示意 图 。 

在 本 地 代码 中 ,通过 偏 移 量 来 定位 本 地 调用 接口 函数 表 中 的 函数 ,如 下 代码 片段 为 本 地 
函数 调用 本 地 接口 函数 GetMethodID 的 语句 。 


lor.w r5,[r2,#136] ;0x88 


blx r5 

第 1 句 取得 GetMethodID 函数 的 地 址 ,一 Se 
下 绰 掉 后 有 A0136 除 a 等 更 本 地 再 mm EE 
用 接口 函数 表 中 第 34 个 接口 函数 就 是 
GetMethodID 函数 。 取 得 的 地 址 存放 在 r5 寄存 CallTpyeMethodO)| | GetTypeField0 
器 中 ,然后 第 2 句 跳 转 到 GetMethodID 函数 的 
地 址 处 开始 执行 ,调用 GetMethodID 函数 。 1 1 

代码 清单 3. 16 “手动 编写 待 调用 的 Java 源 函数 | | 变量 
代码 Java 代 码 


fa 图 3.14 本 地 代码 调用 Java 代码 示意 图 
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jmport android.app.Activity; 
import android.util .Iog; 


inport android.o0s.Bundle; 


Public class Test8d extends Activity { 


private native String HelloWorld (int avStringb,double c); // 声 明 本 地 函数 
static { 
System. loadLibrary ("test8d") ; // 加 载 本 地 库 
} 
private String CallFromNT (int arStringb,double c) /uava 图 数 定义 


时 
Iog.i("loda "int:"+ at " String:"+br" double:"+c)7 
retum "From CallFramNI in Java"; 
} 
@ Override 
Public void oncreate (Bundle savedInstanoeState) { 
super.onCreate (savedInstanceState); 
Log.i ("loda", "libtest8d Before Call JNI HelloWorld"); 
String vstr= "Tt is a stringfrom Java"; 
String vRet= HelloWorld (5799232, vStr, 123.456) ; // 调 用 本 地 函数 
Log.i ("loda", vRet); 
Log.i ("loda", "libtest8d After Call JNI HellofWorld"); 
setContentView QR.1ayout .main); 
} 
} 


如 代码 清单 3. 16 所 示 为 使 用 C 代码 调用 Java 代码 的 例子 中 Java 代码 的 内 容 ,Java 代 
码 中 定义 了 Java 函数 CallFromJNI, 在 C 代 码 中 要 调用 Java 代码 中 的 CallFromJNI 函数 ， 
首先 调用 JNI 接口 函数 (x env) 一 GetMethodID 来 取得 Java 图 数 CallFromJNI 的 
MethodID, 然 后 调用 接口 函数 (x* env) 一 CallObjectMethod 来 调用 指定 MethodID 的 Java 
函数 , 即 完成 了 C 代码 对 Java 代码 的 调用 。C 代码 清单 如 下 所 示 。 

代码 清单 3. 17 手动 编写 调用 Java 的 C 源 代码 


# include< jni.h> 

# include< stdio.h> 

# include< string.h> 

# include< stdlib.h> 

# define IOG TAG "C IOG DTEMD" 

井 Undef IOG 

# include< utils/Iog.h> 

char gmest8Buffer[]= "Unicode basedclabal Sring Reference from ONT C"; 
INIFXPORT jstring JNICALTLJava loda Test8d Test8d HelloWorld (JNTEnv * erv,jobject jobj, jinttest int, 
jstring test string, jdouble test couble) // 本 地 函数 实现 

{ 
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jclass vclass= (* env)- > GetObjectClass (env,]jao)7 
JjmethodT WMethodID= (* env)- > GetMethodTD (env, vClass, "CallFromJNI"," (Tjava/lang/String; D) Ljava/ 


lang/String;"); // 查 找 Java 函数 的 MethodTD 
if (MethodID= = NOLL) 


{ 
TIOGT ("Falied to load JavaFunc CallFramNT") 7 
retum NULL7 
} 
jstring vStr= (* env)- >NewStringUTF (env, gTest8Buffer); 
jstringvRetStr= (* env)- > CallobjectMethod (env, jcbj, WethodmD, 123,vStr, 4321.1234) ; 
// 调 用 Java 函数 
const jbyte * jni string= (* env)- > GetStringITEChars (env, vRetStr, 0); 
if (jni string==NULL) 
{ 
retum NOLL; 
} 
LOGI ("Java Method Retum String:%s", jni string); 
(* env)- > ReleaseStringUTFChars (envvRetstt/ 黎 放 知 街 记 资源 
retum vstr; 


小 结 


本 章 主要 分 析 了 Android 系统 Dalvik 虚拟 机 的 本 地 调用 机 制 的 实现 原理 和 工作 流程 。 
通过 实际 编程 实践 ,总 结 了 使 用 本 地 调用 机 制 编程 的 主要 步 又 和 过 程 : 通 过 分 析 源 代码 得 到 
了 Dalvik 虚拟 机 建立 本 地 调用 机 制 环境 的 过 程 和 调用 的 主要 函数 ,以 及 Java 代码 和 C 代 
码 互相 调用 的 详细 过 程 ,更 加 微观 地 描述 了 本 地 调用 机 制 的 工作 流程 。 


87 


D+€ 
反射 机 制 模块 的 原理 及 实现 


本 章 内 容 提 要 


如 什么 是 反射 机 制 ? 

名 反射 机 制 有 什么 作用 ? 

名 反射 机 制 的 内 部 函数 结构 是 什么 样 的 ? 
如 反射 机 制 是 如 何 实现 的 ? 

名 反射 机 制 有 什么 优点 和 不 足 ? 


反射 机 制 是 Dalvik 虚拟 机 中 的 核心 机 制 ,也 是 Android 开发 中 不 可 缺少 的 重要 工具 。 
本 章 将 围绕 以 上 5 点 对 Dalvik 虚拟 机 中 的 反射 机 制 进 行 细致 的 分 析 。 首 先 概述 什么 是 反 
射 机 制 ,以 及 反射 机 制 在 Dalvik 虚拟 机 中 和 Android 平台 上 的 地 位 和 作用 。 随 后 对 反射 机 
制 的 实现 原理 进行 深入 剖析 ,详细 分 析 反 射 机 制 内 部 的 核心 类 和 函数 ,总 结 归 纳 反 射 机制 的 
具体 实现 流程 。 由 于 反射 机 制 与 Dalvik 虚拟 机 中 的 其 他 机 制 和 模块 不 同 , 它 更 像 是 一 个 便 
于 Android 开发 的 工具 ,所 以 本 章 最 后 一 节 将 介绍 Android 开发 人 员 在 开发 具体 应 用 时 是 
如 何 使 用 反射 机 制 的 。 


4.1 概述 


在 计算 机 领域 中 ,反射 是 指 一 类 应 用 ,它们 能 够 自 描述 和 自控 制 。 也 就 是 说 ,这 类 应 用 
通过 采用 某 种 机 制 来 实现 对 自己 行为 的 描述 (self-representation) 和 监测 (examination) ,并 
能 根据 自身 行为 的 状态 和 结果 ,调整 或 修改 应 用 所 描述 行为 的 状态 和 相关 的 语义 。 

同时 ,反射 机 制 是 Java 被 当 作 动 态 ( 或 准 动态 ) 语 言 的 一 个 关键 性 质 。 反 射 机 制 允 
许 程 序 在 运行 的 过 程 中 通过 反射 机 制 的 API 取得 任何 一 个 已 知名 称 的 类 的 内 部 信息 ， 
包括 其 中 的 描述 符 、 超 类 ,也 包括 属性 和 方法 等 所 有 信息 ,并 且 可 以 在 程序 运行 时 改变 
属性 的 相关 内 容 或 调用 其 内 部 的 方法 。 合 理 熟练 地 运用 反射 机 制 可 以 让 Java 程序 变 
得 更 加 灵活 ,让 程序 得 到 更 新 而 不 用 改动 原 有 的 方法 代码 的 目标 得 以 实现 。 另 外 ,类 
反射 机 制 在 数据 库 方面 的 应 用 更 是 非常 广泛 。 同 时 ,反射 机 制 具 有 很 好 的 派生 性 , 例 
如 ,Java 语言 基于 类 反射 技术 还 开发 提供 了 动态 代理 和 元 数据 两 种 机 制 , 使 程序 逻辑 
更 加 简单 安全 性 更 高 。 对 于 这 两 种 机 制 ,会 在 后 面 的 章节 中 具体 介绍 它们 的 实现 原理 
以 及 功能 架构 。 
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4.2 反射 机 制 实现 代码 示例 


反射 机 制 和 Dalvik 虚拟 机 中 的 其 他 模块 和 机 制 不 同 , 它 更 像 是 一 种 方便 程序 员 编 写 
Java 程序 使 程序 更 加 灵活 简洁 的 工具 。 所 以 不 但 要 了 解 反 射 机 制 的 实现 原理 和 内 部 结构 ， 
还 要 学 习 如 何 使 用 反射 机 制 来 编写 更 加 灵活 的 程序 。 首 先 通过 具体 的 示例 来 形象 地 展示 什 
么 是 反射 机 制 ,反射 机 制 在 具体 程序 中 是 如 何 应 用 的 以 及 反射 机 制 的 作用 是 什么 。 

代码 清单 4.1 手动 编写 : forName. java 源 代码 


inport java.lang.reflect .Method; 

jmport java.util .Random; 

class simple 00{ 

Public String get 0() { 
retum "0"7 

} 

Public String get 1() { 
retum "1"; 

} 

Public String get 2() { 
retum "2"; 

} 

Public String get 3() { 
retum "3"; 

} 

Public String get 4() { 
retum "4"; 

} 

»; 

class simple 01{ 

Public String get 0() 
retum "0"7 

} 

public String get 1() 
retum ml 

Public String get 2() 
retum "2"; 

. 

Public String get 3() 
retum "3"; 

} 

Public String get 4() 
retum "4a"; 


} 
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了 

class simple 02{ 

Public String get 0() { 
retum "0"7 

人 

Public String get 1() { 
retum "1"; 

} 

Public String get 2() { 
retum "2"; 

Public String get 3() { 
retum ™ 


和 
Public String get 4() { 
retum "4"; 


}; 
public final class test 1 { 
Public void run (int cnt) { 
Randcm randomGenerator= new Random(); 
int cidx; 
for (int i=0; ji< cnt;y i++) { 
Cidx= randomGenerator.nextInt (3)7 
try { 

Class< ?> clazz= ClassClass.forName ("simple 0"+ Integer.toString (cidx)); 
Method method= clazz.getpeclaredMethod ("get 0"); 
method. invoke (clazz .newInstance ()); 

} catch (Exception ioe) { 
System.out.println (ioe); 


} 

Public static void main (final String[] args) { 
long time before= System.currentTimeMillis (); 
test 1 test=new test 1(); 
test.run(10000)7 
long time after= System.currentTimeMillis ()7 
long different= time after -time before; 
System.cut.println (different); 

} 

} 


首先 这 段 代 码 定义 了 三 个 类 simple_00、simple_01 和 simple_02, 然 后 在 每 个 类 中 又 定 
义 了 5 个 方法 String get_0()、String get_1() 、String get_2()、String get_3() 以 及 String 
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get_4() ,这 些 方法 的 作用 是 分 别 返 回 结 果 0、1、2、3、4。 随 后 程序 运用 Random() 函 数 产 生 
了 一 个 随机 数 , 并 且 赋 值 给 cidx, 并 且 运 用 反射 机 制 中 常见 的 方法 Class. forName 获得 指定 
名 称 的 类 并 输出 结果 。 关 于 Class. forName 的 具体 实现 流程 在 后 面 的 章节 中 将 详细 讲述 。 

点 拨 在 程序 员 编 写 一 个 Android 程序 时 需要 用 到 许多 私有 方法 ,这 些 私有 方法 不 能 
被 直接 调用 ,比如 endCall 方法 。 这 个 方法 的 主要 作用 是 自动 挂 断 电话 ,在 编写 黑 名 单 管 理 
应 用 的 时 候 程 序 员 必 须 调 用 这 个 方法 才能 对 指定 的 电话 号 进行 拦截 挂 断 。 但 是 endCall 方 
法 在 Android 1.5 以 后 被 设置 为 私有 方法 了 。 所 以 如 果 要 实现 对 指定 电话 自动 挂 断 的 功能 
就 一 定 要 用 到 反射 机 制 。 下 面 将 介绍 如 何在 具体 应 用 中 运用 反射 实现 自动 挂 断 电话 的 
功能 。 

首先 利用 反射 机 制 中 的 Class. forName 方法 获得 ServiceManager,ServiceManager 是 Android 
平台 中 的 一 个 基本 模块 , 它 是 用 来 管理 Android 系统 中 的 service, 如 InputMethodService、 
ActivityManagerService 等 服务 。 再 通过 反射 机 制 中 的 getMethod 方法 调用 服务 管理 模块 中 的 
getService 方法 得 到 telephone 的 IBinder, 再 将 IBinder 转化 为 ITelephony 接口 。ITelephony 是 
Android 系统 中 基本 程序 框架 功能 之 一 ,主要 提供 和 电话 相关 的 API 交互 。 至 此 ,程序 获得 了 
ITelephony 类 中 最 为 关键 的 endCall() 方 法 ,在 需要 的 部 分 即 可 调用 endCall 〇 方法 来 实现 自动 挂 
断 电 话 的 功能 。 

代码 清单 4.2 lanjie. java 源 代码 


if (act.equals (PHONE STATE)) { 
String nm bundle.getString ("inoming nmiber"); 
// 判 断 来 电 , 并 显示 文本 
Toast .makeText (context," 有 来 电 ",Toast.IENGTH IONG) 
-Show(); 
if (mm !=null && mm.length() >0) { 
FilterTB fcb= new FilterTB (oontext); 
EhoneDB phoneItemr fdb.getEhoneItem (num) ; 
证 (choneItem !=null && phoneItem.isPhoneDisabled()) { 
// 调 用 stopcal1() 函 数 对 指定 来 电 进 行 拦 截 
Toast .makeText (context, "拦截 来 电 ", Toast .IENGTH ICNG) 
-Show()7 
StcpCall (); 
Toast.makeText (context, "拦截 完毕 "Toast.IENGTH ICNG) 
-Show()7 
FilterInoming in new FilterIncoming()7 
in.setpate (new Date()); 
in.setItemId (phoneItem.get1d()); 
in.setNm(num; 
fcb.insertInoming (in); 
} 
fdb.close(); 
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private void stopcall() { // 运 用 反射 原理 调用 被 隐藏 的 stqpcal1() 函 数 
try{ 
Method method; 
method= Class. forName ("android.o0s.ServiceManager") .getMethod ( 
"getServios", String.class); 
JIBinder binder= (IBinder) method.invoke (null, 
new Gbject[] { Context .TETEPHONY SERVICE }); 
ITelephony telephony= TTelephony.Stub.asInterface (binder) ; 
telephony.endcall (); 
telephony.cancelMi ssedcallsNotification(); 
} catch (SecurityExcepticn e) { 
e.printStackTrace ()7 
} catch NoSudiMethodExosption e) { 
e.printstackTrace (); 
} catch (ClassNotFoundExosption e) { 
e.printStackTrace (); 
} catch (TllegalArgmentExosption e) { 
e.PrintStackTrace ()7 
} catch (IllegalAcoessExosption e) { 
e.PrintStackTrace (); 
} catch (InvocationTargetFxcepticn e) { 
e.printstackTrace (); 
} catch (RempteException e) { 
e.printstackTrace ()7 
} 
} 


通过 以 上 两 个 例子 可 以 清楚 地 发 现 反射 机 制 在 编写 Java 程序 和 Android 应 用 时 的 两 
个 重要 作用 : 获取 不 知名 的 类 和 使 用 一 些 已 被 隐藏 的 类 。 下 面 将 对 反射 机 制 的 API 和 内 部 
函数 及 实现 原理 进行 详细 的 分 析 。 


4.3 反射 机 制 API 分 析 


Java 反射 机 制 让 程序 员 在 程序 运行 状态 中 ,可 以 对 于 任意 一 个 类 ,都 能 够 获取 这 个 类 
的 所 有 属性 和 方法 ;对 于 任意 一 个 对 象 ,都 能 够 调用 它 的 任意 一 个 方法 :总 的 来 说 反射 机 制 
主要 提供 了 以 下 4 种 功能 : 四 在 运行 时 判断 任意 一 个 对 象 所 属 的 类 ; 四 在 运行 时 构造 任意 
一 个 类 的 对 象 ; 加 在 运行 时 判断 任意 一 个 类 所 具有 的 成 员 变 量 和 方法 ; 中 在 运行 时 调用 任 
意 一 个 对 象 的 方法 并 生成 动态 代理 。 


4.3.1 反射 机 制 API 分 析 概 述 


在 Java 核心 库 中 主要 有 以 下 几 个 类 承担 了 类 反射 机 制 的 全 部 功能 ,它们 分 别 是 : 
Class、Field、Constructor、Method、Array, 这 几 个 类 的 功能 以 及 它们 所 提供 的 方法 见 
表 4.1。 


类 名 
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表 4.1 反射 机 制 中 的 关键 类 
关键 方法 


Class 


Class 类 的 实例 
表示 正在 运行 的 
Java 应 用 程序 
中 的 类 和 接口 


forName(): 返回 与 带 有 给 定 字符 串 名 的 类 或 接口 相关 联 的 Class 对 象 


getFields() : 获得 类 的 public 类 型 的 属性 


getDeclaredFields() : 获得 类 的 所 有 属性 


getMethods() : 获得 类 的 public 类 型 的 方法 


getDeclaredMethods() : 获得 类 的 所 有 方法 


getMethod( String name, Class[ ] parameterTypes ): 获得 类 的 特定 方法 ， 
name 参数 指定 方法 的 名 字 ,parameterTypes 参数 指定 方法 的 参数 类 型 


getConstructors(): 获得 类 的 public 类 型 的 构造 方法 


getConstructor(Class[ ] parameterTypes): 获得 类 的 特定 构造 方法 ， 
parameterTypes 参数 指定 构造 方法 的 参数 类 型 


newlInstance(); 通过 类 的 不 带 参 数 的 构造 方法 创建 这 个 类 的 一 个 对 象 


Field 


Field 提供 有 关 
类 或 接口 的 单个 
字段 的 信息 ,以 
及 对 它 的 动态 访 
问 权限 。 反 射 的 


get(): 返回 指定 对 象 上 此 Field 表示 的 字段 的 值 


getDeclaringClass(): 返回 表示 类 或 接口 的 Class 对 象 ,该 类 或 接口 声 
明 由 此 Field 对 象 表示 的 字段 


getModifiers(): 以 整数 形式 返回 由 此 Field 对 象 表示 的 字段 的 Java 语 
言 修饰 符 


字段 可 能 是 一 个 
类 (静态 ) 字 段 或 
实例 字段 


set() : 将 指定 对 象 变量 上 此 Field 对 象 表 示 的 字段 设置 为 指定 的 新 值 


toString(): 返回 一 个 描述 此 Field 的 字符 串 


Method 


Method 提供 关 
于 类 或 接口 上 单 
独 某 个 方法 (以 
及 如 何 访问 该 方 
法 ) 的 信息 。 所 
反映 的 方法 可 能 
是 类 方法 或 实例 
方法 (包括 抽象 
方法 ) 


getDeclaringClass(): 返回 表示 声明 由 此 Method 对 象 表示 的 方法 的 类 
或 接口 的 Class 对 象 


invoke(): 对 带 有 指定 参数 的 指定 对 象 调用 由 此 Method 对 象 表示 的 底 
层 方法 


getModifiers(): 以 整数 形式 返回 此 Method 对 象 所 表示 方法 的 Java 语 
言 修饰 符 


getName(): 以 String 形式 返回 此 Method 对 象 表示 的 方法 名 称 


getReturnType(): 返回 一 个 Class 对 象 , 该 对 象 描述 了 此 Method 对 象 
所 表示 的 方法 的 正式 返回 类 型 


Constructor 


Constructor 提 
供 关于 类 的 单个 
构造 方法 的 信息 
以 及 对 它 的 访问 
权限 


newlInstance(): 使 用 此 Constructor 对 象 表示 的 构造 方法 来 创建 该 构 
造 方 法 的 声明 类 的 新 实例 ,并 用 指定 的 初始 化 参数 初始 化 该 实例 


isVarArgs(): 如 果 声 明 此 构造 方法 可 以 带 可 变数 量 的 参数 , 则 返回 
true; 否 则 返回 false 


getDeclaringClass() : 返回 Class 对 象 ,该 对 象 表 示 声 明 由 此 Constructor 对 
象 表示 的 构造 方法 的 类 


getModifiers() : 以 整数 形式 返回 此 Constructor 对 象 所 表示 构造 方法 
的 Java 语言 修饰 符 


toString(): 返回 描述 此 Constructor 的 字符 串 


Array 


Array 类 提供 了 
动态 创建 和 访问 
Java 数组 的 
方法 


newJInstance() : 创建 一 个 具有 指定 的 组 件 类 型 和 长 度 的 新 数组 


set() : 将 指定 数组 对 象 中 索引 组 件 的 值 设置 为 指定 的 新 值 


get() : 返回 指定 数组 对 象 中 索引 组 件 的 值 


getLength(): 以 int 形式 返回 指定 数组 对 象 的 长 度 


Qa 
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从 表 4. 1 中 可 以 很 清晰 地 看 出 ,反射 机 制 所 涉及 的 各 个 类 以 及 其 相关 方法 ,主要 实现 了 
对 三 类 信息 的 获取 和 使 用 : 构造 函数 ,字段 和 方法 。 而 在 这 些 类 中 ,最 重要 的 类 是 Class 类 ， 
该 类 为 前 面 提 到 的 每 一 类 信息 设计 封装 了 4 种 独立 的 反射 调用 ,可 以 根据 不 同 的 需要 调用 
相应 的 反射 方法 获取 了 相应 所 需 的 反射 类 型 的 实例 对 象 。 

由 此 可 以 看 出 Class 类 的 重要 性 一 一 要 想得到 Field、Method 以 及 Constructor 等 类 的 
实例 对 象 必须 经 过 Class 类 ,因而 可 以 得 出 Class 类 是 反射 机 制 的 源头 。 


4.3.2 代理 模式 API 分 析 


代理 模式 是 常用 的 Java 设计 模式 , 它 的 特征 是 代理 类 与 委托 类 有 同样 的 接口 ,代理 类 
主要 负责 为 委托 类 预 处 理 消息 、 过 滤 消 息 、 把 消息 转发 给 委托 类 ,以 及 事后 处 理 消息 等 。 代 
理 类 可 以 提供 对 另 一 个 对 象 的 访问 ,同时 隐藏 实际 对 象 的 具体 实例 。 代 理 一 般 会 实现 它 所 
表示 的 实际 对 象 的 接口 。 代 理 可 以 访问 实际 对 象 ,但 是 延迟 实现 实际 对 象 的 部 分 功能 ,实际 
对 象 实现 系统 的 实际 功能 ,代理 对 象 对 客户 隐藏 了 实际 对 象 。 客 户 不 知道 它 是 与 代理 打 交 
道 还 是 与 实际 对 象 打交道 。 代 理 类 与 委托 类 之 间 通 常会 存在 关联 关系 ,一 个 代理 类 的 对 象 
与 一 个 委托 类 的 对 象 关联 ,代理 类 的 对 象 本 身 并 不 真正 实现 服务 ,而 是 通过 调用 委托 类 的 对 
象 的 相关 方法 ,来 提供 特定 的 服务 。 而 动态 代理 则 是 在 程序 运行 时 ,运用 反射 机 制 动 态 创建 
而 成 。 

因此 ,这 种 机 制 既然 是 依托 于 反射 机 制 而 建立 ,那么 本 报告 也 对 动态 代理 机 制 进行 一 定 
程度 的 分 析 , 代 理 类 Proxy 的 相关 信息 如 表 4. 2 所 示 。 


表 4.2 代理 类 Proxy 的 相关 信息 
类 名 简 介 相关 方法 


构造 方法 

Proxy(): 使 用 其 调用 处 理 程序 的 指定 值 从 子 类 (通常 为 动态 代理 类 ) 构 
本 P 实 

Proxy 提供 用 于 人 

创建 动态 代理 类 | 关键 方法 

和 实例 的 静态 方 getInvocationHandler(): 返回 指定 代理 实例 的 调用 处 理 程序 

Proxy 法 , 它 还 是 由 这 

些 方法 创建 的 所 getProxyClass(): 返回 代理 类 的 java. lang. Class 对 象 , 并 向 其 提供 类 

有 动态 代理 类 的 | 加 载 器 和 接口 数组 

超 类 isProxyClass(): 当 且 仅 当 指定 的 类 通过 getProxyClass 方法 或 

newProxyInstance 方法 动态 生成 为 代理 类 时 ,返回 true 

newProxyJInstance(): 返回 一 个 指定 接口 的 代理 类 实例 ,该 接口 可 以 将 

方法 调用 指派 到 指定 的 调用 处 理 程 序 


点 拨 从 Java API 这 一 层次 程序 员 不 能 很 好 地 发 现 动态 代理 机 制 和 类 反射 机 制 有 何 
种 联系 ,实际 上 它们 的 具体 联系 是 : 它们 都 使 用 同一 种 思路 完成 它们 各 自 的 功能 都 是 
将 方法 的 具体 实现 放 在 虚拟 机 中 ,而 且 共 享 部 分 关键 的 实现 函数 和 数据 结构 。 


4.3.3 元 数据 注释 机 制 API 分 析 
在 reflect 文件 夹 中 除了 反射 机 制 和 动态 代理 之 外 ,还 包含 一 个 Annotation. cpp 文件 ， 


第 4 章 反射 机 制 模块 的 原理 及 实现 


它 就 是 注释 类 ,是 Java5 的 一 个 新 特性 ,JDK5 引入 了 Metedata( 元 数据 ) 的 概念 ,很 容易 地 
就 能 够 调用 Annotations 提供 一 些 本 来 不 属于 程序 的 数据 。 所 谓 的 元 数据 ,就 是 “关于 数据 
的 数据 *”。 用 于 标示 程序 中 各 个 数据 、 方 法 以 及 属性 的 信息 ,还 包括 对 构造 器 的 声明 、 域 声 
明 、 局 部 变量 声明 以 及 方法 声明 等 重要 的 功能 。 因 此 ,适当 地 应 用 元 数据 可 以 很 好 地 提高 程 
序 的 功能 性 和 稳定 性 。 在 Class 类 中 就 为 元 数据 封装 了 相应 的 方法 ,在 取得 相应 的 注释 类 
型 实例 后 ,再 通过 反射 机 制 ,可 以 对 元 数据 进行 取得 或 修改 。 “注释 "类 的 相关 信息 如 表 4. 3 
所 示 。 


表 4.3 注释 类 的 相关 信息 
类 名 简 介 相关 方法 
用 于 标示 程序 中 各 个 数 | annotationType(): 返回 此 annotation 的 注释 类 型 


据 、 方 法 以 及 属性 的 信 | equals() : 如 果 指 定 的 对 象 表示 在 逻辑 上 等 效 于 此 接口 的 注释 ， 
息 ,还 包括 对 构造 器 的 | 则 返回 true 

声明 , 域 声明 局 部 变量 
声明 以 及 方法 声明 等 重 


Annotation 


hashCode(): 返回 此 annotation 的 哈 希 码 


要 的 功能 toString() : 返回 此 annotation 的 字符 串 表 示 形 式 


点 拨 反射 机 制 虽 然 是 以 Java API 的 形式 服务 于 上 层 的 Java 应 用 ,但 它 和 Dalvik 虚 
拟 机 的 关系 是 十 分 紧密 的 。 实 际 上 ,反射 机 制 的 API 的 具体 实现 是 依托 于 虚拟 机 Dalvik， 
它 的 实现 机 理 简 单 来 说 是 : 上 层 Java 方法 通过 JNI 机 制 ( 本 地 调用 机 制 ) 调 用 Dalvik 虚拟 
机 内 部 函数 以 完成 其 具体 功能 ,再 将 运行 结果 逐 层 返回 给 上 层 应 用 。 也 就 是 说 反射 机 制 的 
执行 模块 是 在 虚拟 机 中 ,脱离 虚拟 机 独立 存在 的 反射 机 制 只 能 是 一 个 空 架子 。 


4.4 反射 机 制 的 “三 层 ” 实 现 体 系 


4.4.1 类 反射 机 制 在 Dalvik 虚拟 机 内 部 的 实现 


Java API 是 面向 上 层 应 用 开发 ,而 这 些 封装 在 Java 核心 库 中 的 API 所 涉及 的 各 个 方 
法 的 具体 实现 是 在 Dalvik 虚拟 机 中 ,而 中 间 起 a 
一 层 : JavaAPI 层 

到 过 渡 作 用 的 是 JNI 本 地 方法 调用 机 制 。 在 本 | 包含 forName 等 Java 方 法 | 


节 中 将 详细 介绍 一 下 Java API 在 虚拟 机 内 部 

实现 的 机 理 ,首先 通过 观察 图 4. 1 可 以 很 好 地 让 反 

对 反射 机 制 实现 所 需要 的 三 层 结构 有 一 个 直观 由 

的 认识 第 二 层 : 本 地 方法 集 制 
Re Dalvik_java_lang_reflect_Class_classForName 茶 
在 图 4. 1 中 位 于 最 上 层 的 是 Java API, 直 等 本 地 方法 的 

接 决定 了 虚拟 机 该 如 何 工作 ;中间 层 是 JNI 机 下 

制 ,用 于 衔接 Java 方法 和 底层 的 本 地 方法 ;下 ES 全 

层 是 本 地 方法 ,用 于 接口 方法 的 直接 实现 。 报 - - 

告 将 分 别 对 类 反射 机 制 的 5 个 关键 类 进行 详细 | ee 

分 析 , 着 重 分 析 其 工作 流程 以 及 其 关键 的 实现 的 底层 函数 


函数 分 析 。 4.1 类 反射 机 制 实现 的 三 层 结构 图 
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4.4.2 三 层 结 构 实例 展示 


在 函数 详细 分 析 之 前 , 先 通过 一 段 具 体 代码 直观 展示 一 下 类 反射 机 制 的 三 层 调用 关系 ， 
提前 熟悉 这 三 层 调用 关系 可 以 很 好 地 帮助 读者 对 后 面 内 容 的 理解 。 

下 面 以 Class 类 中 的 静态 方法 Class. forName 为 例 ,介绍 一 下 这 个 实现 流程 。 

先 来 看 反射 机 制 的 第 一 层 Java API 层 : 在 核心 库 中 找到 Class 类 的 定义 处 Java\ 
lang\Class. java, 从 这 个 路 径 可 以 看 出 lang 文件 夹 就 是 在 Java 编程 中 默认 引入 的 lang 包 ， 
在 这 个 Class. java 文件 中 找到 Class. forName 方法 的 原始 定义 处 。 

代码 清单 4.3 libcore\luni\src\main\java\java\lang\class. java: forName() 源 代码 


Public static Class< ?> forName (String className,boolean initializeBoolean, 
ClassLoader classLoader) throws ClassNotFoundExosption { 
if (classIoader==null) { 
classIoader= ClassIoader.getsystemclassIoader (); 
} 
Class< ?> result; 
try { 
result= classForName (className, initializeBoolean, 
ClassIoader) 7 
} catch (ClassNotFoundExcepticn e) { 
Throwable cause= e.getCause ()7 
if (cause instanceof ExosptionInInitializerError) { 
throw (ExosptionInInitializerError) cause; 
} 
throw e; 
} 
retum result; 
于 


通过 简单 的 分 析 ,这 个 方法 实际 上 是 通过 调用 另外 一 个 classForName 方法 根据 一 个 已 
知 的 类 名 从 虚拟 机 中 加 载 并 初始 化 这 个 类 ,在 源码 中 再 次 回溯 找到 这 个 classForName 方法 
的 定义 。 

代码 清单 4.4 libcore\luni\src\main\java\java\lang\class. java: classForName 源 

代码 


static native Class<?> classForName (String className, boolean initialize Boolean, ClassLoader 
classIoader) throws ClassNotFoundExosption; 
然而 这 个 方法 并 没有 具体 的 方法 体 , 需 要 注意 到 这 个 方法 实际 上 是 一 个 Native 方法 ， 
这 就 意味 着 Class. forName 方法 在 这 里 需要 通过 JNI 机 制 调用 虚拟 机 中 的 本 地 方法 去 代 它 
完成 既定 的 目标 ,回溯 到 android_dalvik_source\vm\native 文件 夹 (这 就 是 第 二 层 一 一 本 地 
方法 集 ) ,其 中 java_lang_Class. cpp 文件 便 是 对 应 Class. java 文件 中 所 涉及 的 所 有 本 地 方 
法 ,在 java_lang_Class. cpp 文件 中 找到 该 方法 的 C 语言 实现 。 
代码 清单 4.5 dalvik\vm\native\ java_lang_Class. cpp: Dalvik_java_lang_Class_classForName 
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源 代 码 
static void Dalvik java lang Class classForName (const u4* args,JValue* pResult) 
{ 
StringCbject* namecbj= (Stringobject* ) args[0]; 
bool initialize= (args[1] !=0); 
Cbject* loader= (Cbject* ) args[2]; 


RETURN PTR (dFindclassByName (nameQbj, loader, initialize)); 
对 这 上段 代码 简单 分 析 可 以 发 现 ,这 个 函数 实际 上 是 通过 调用 dvmFindClassByName 函 
数 实现 其 功能 的 ,而 dvmFindClassByName 函数 的 具体 定义 在 android_dalvik_source\vm\ 
native\InternalNative. cpp 文件 中 (这 就 是 第 三 层 Dalvik 虚拟 机 内 部 的 功能 点 函数 层 ) 。 
代码 清单 4. 6 libcore\luni\src\main\java\java\lang\class. java: dvmFindClassByName 
源 代码 
Classobject * dFindclassByName (Stringcbjectx nameobj,Gbjectx* loader, 
bool doInit) 


{ 
ClassCbject * clazz=NULL; 
Char* name=NULL; 
charx descriptor=NULL; 


证 oameGoj==NOLD) { 
dmthrouNullFointerException name== null) 
goto bail; 
} 
name= dnCreateCstrFromString (namecboj) 7 
在 这 个 函数 定义 中 ,可 以 发 现 dvmFindClassByName 函数 还 调用 了 其 他 一 些 函 数 完成 
其 功能 。Class. forName 的 实现 过 程 很 好 地 验证 了 确实 存在 一 种 “三 层 关系 ”一 一 核心 库 、 
JNI 以 及 虚拟 机 , 即 核心 库 中 的 Java 方法 通过 JNI 机 制 调用 虚拟 机 源码 中 vm 文件 夹 下 
native 文件 夹 中 的 本 地 方法 集 , 再 由 这 些 本 地 方法 函数 调用 虚拟 机 中 另外 的 一 些 功 能 点 函 
数 去 完成 相应 的 目标 。 
点 拨 ”虚拟 机 在 实现 一 个 API 的 功能 时 的 执行 流程 是 : 上 层 的 接口 负责 接收 参数 、 指 
令 , 经 过 中 间 JNI 机 制 的 转发 将 这 些 控制 信息 交付 给 底层 虚拟 机 内 部 的 执行 函数 实现 其 功 
能 ,最 后 将 结果 逐 层 返回 给 上 层 调 用 ,完成 对 一 个 方法 的 实现 。 


4.5 反射 机 制 实现 分 析 


4.5.1 Class 类 详细 分 析 


对 于 Class 类 ,读者 已 经 知道 它 是 反射 机 制 的 源头 .而 它 究竟 能 做 些 什么 以 及 它 是 如 何 
实现 这 些 功能 的 ,本 节 将 对 Class 类 进行 详细 分 析 。 


mz 
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1. 构造 函数 的 处 理 


根据 需求 的 不 同 可 分 为 以 下 4 个 方法 。 

Constructor getConstructor() 一 一 获得 使 用 特殊 的 参数 类 型 的 公共 构造 函数 。 
Constructor[ jgetConstructors() 一 一 获得 类 的 所 有 公共 构造 函数 。 

Constructor getDeclaredConstructor() 一 一 获得 使 用 特定 参数 类 型 的 构造 函数 。 
Constructor[ ]getDeclaredConstructors() 一 一 获得 类 的 所 有 构造 函数 。 

首先 通过 观察 getConstructor() 函数 代码 绘制 流程 图 如 图 4.2 所 示 。 


ry 人 getConstructor Java 方 法 
的 公共 构造 函数 
getConstructorOrMethod 


getDeclaredConstructorOrMethod 


---------------------------- EE JNI 调 用 

a ， Dalvik_ java_lang_Class_getDeclare :五 关口 

位 于 vm 文件 Fnative 文 件 夹 dConstructorOrMethod C 语 言 函 数 

2 一 一 本 地 方法 调 
功能 函数 函数 


位 于 vm 文件 夹 下 reflect 文 件 dvmGetDeclaredConstructorOrMethod 


4.2 ”getConstructor() 方 法 流程 图 


再 绘制 getConstructors() 方 法 的 流程 图 如 图 4. 3 所 示 。 


ee 导 getConstructors Java 方 法 
有 公共 构造 函数 1 

getDeclaredConstructors 
一 es JNI 调 用 
位 于 vm 文 件 下 native | Dalvik_java_lang_Class_getDecl 证 妆 孙 
文件 夹 aredConstructors C 语 言 函数 
一 一 一 一 一 一 一 一 一 一 一 一 二 一 一 一 一 一 一 一 一 一 一 二 一 一 一 二 二 一 一 二 一 一 二 一 一 一 本 地 方法 
位 于 vm 文件 夹 下 di 


reflect 文 件 dvmGetDeclaredConstructors 


4.3 ”getConstructors() 方 法 流程 图 


从 图 4. 3 中 经 分 析 可知, getConstructors 中 方法 实际 上 是 通过 调用 本 地 方法 
getDeclaredConstructorOrMethod 接口 从 Java 语言 过 渡 到 C 语言 ,再 通过 虚拟 机 内 部 本 地 方法 集 
Dalvik_java_lang_Class _ getDeclaredConstructorOrMethod 将 相关 参数 传递 给 实际 执行 函数 
dvmGetDeclaredConstructorOrMethod 完成 getConstructor() 方法 的 实际 功能 ;在 对 
getDeclaredConstructor() 方 法 进行 分 析 时 ,发 现 dvmGetDeclaredConstructors 函数 是 该 方法 的 
本 地 实现 函数 。 同 时 经 过 对 源码 的 验证 ,发 现 该 dvmGetDeclaredConstructorOrMethod 函数 和 
dvmGetDeclaredConstructors 函数 确实 封装 在 reflect. cpp 中 ,由 此 可 见 上 文 的 分 析 思 路 与 结果 
是 正确 的 ,也 证 明了 反射 机 制 的 具体 实现 确实 在 虚拟 机 内 部 。 另 外 ,在 报告 的 “关键 函数 详细 
分 析 ” 部 分 中 , 本文 会 对 以 上 两 个 dvmGetDeclaredConstructorOrMethod 函数 和 
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dvmGetDeclaredConstructors 函数 的 内 部 实现 机 制 进行 具体 的 分 析 。 
利用 这 种 方法 本 文 为 其 他 两 个 方法 getDeclaredConstructor() 以 及 getDeclaredConstructor() 


均 绘 制 了 方法 流程 图 并 对 它们 在 实现 过 程 中 所 调用 的 函数 进行 了 归纳 总 结 ， 


图 4.4 所 示 。 


getConstru 


ctor 


反射 机 制 模块 的 原理 及 实现 


发 现 其 对 应 关系 如 


getDeclaredConstructor 


dvmGetDeclaredConstructorOrMethod 


: 


getConstructors 
dvmGetDeclaredConstructors 
getDeclaredConstructor 


图 4.4 构造 函数 相关 的 对 应 关系 图 


点 拨 这 4 个 Java 方 法 对 应 底层 两 个 具体 实现 函数 ,对 底层 函数 的 分 析 发 现 , 通 过 区 
分 底层 函数 的 入 口 参数 就 可 以 完成 不 同 Java 方法 的 实现 目的 ,也 就 实现 了 对 函数 的 高 效 


利用 。 


2. 对 方法 的 处 理 


根据 需求 的 不 同 可 分 为 以 下 4 个 方法 。 


Method getMethod() 一 一 使 用 特定 的 参数 类 型 ,获得 命名 的 公 


Method[ jgetMethods() 一 一 获得 类 的 所 有 公共 方法 。 
Method getDeclaredMethod() 一 一 获得 类 声明 的 命名 的 方法 。 
Method[ jgetDeclaredMethods() 一 一 获得 类 声明 的 所 有 方法 。 


N 共 方法 。 


首先 通过 观察 getMethod() 方 法 的 代码 绘制 流程 图 如 图 4.5 所 示 。 
getMethod 方 法 主要 本 和 
实现 了 一 获得 使 Se 
用 特殊 的 参数 类 型 1 
的 公共 方法 getConstructorOrMethod Java 方 法 
getDeclaredConstructorOrMethod 
位 于 vm 文件 Fnative | Dalvik_ java_ lang_Class_getDecl C 语 言 函数 


葡 件 类 


位 于 vm 文 件 夹 下 
reflect 文 件 


aredConstructorOrMethod 


dvmGetDeclaredConstructorOr 
Method 


4.5 ”getMethod() 方 法 流程 图 


再 绘制 getMethods() 方 法 的 流程 图 如 图 4.6 所 示 。 

获取 类 中 方法 的 这 组 接口 的 实现 原理 与 结构 和 构造 函数 一 样 ,都 是 通过 调用 本 地 方法 
完成 其 方法 功能 。 通 过 对 另外 两 个 方法 getDeclaredMethod() 和 getDeclaredMethods() 绘 
制 流程 图 并 归纳 总 结 发 现 上 层 接口 与 底层 具体 实现 函数 有 如 下 对 应 关系 ,如 图 4.7 所 示 。 
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getMethods 方 法 主要 getMethods 
实现 了 一 一 获得 所 有 
公共 方法 1 

getPublicMethodsRecursive Java 方 法 

getDeclared Methods 

| 于 -有 
位 于 vm 文件 Fnative | Dalvik_java_lang_Class_getDecl C 语 言 函 数 
文件 夹 aredMethods a 
De 人 本 地 方法 
i 调用 功能 
人 辣 dvmGetDeclaredMethods 函数 


4.6 ”getMethods() 方 法 的 流程 图 


getMethod 
上 dvmGetDeclaredConstructorOrMethod 


getDeclaredMethod 
getMethods 
H dvmGetDeclaredMethods 


getDeclaredMethod 


4.7 方法 相关 的 对 应 关系 图 


从 图 4.7 可 以 知道 ,Class 类 中 用 于 获得 方法 信息 的 4 个 反射 方法 分 别 对 应 底层 的 两 个 
实现 函数 ,和 获取 构造 函数 信息 的 情形 相同 ,这 里 涉及 的 两 个 底层 执行 函数 会 在 报告 的 “ 关 
键 函 数 详细 分 析 ” 部 分 中 进行 详细 分 析 。 


3. 对 字段 的 处 理 


根据 需求 的 不 同 可 分 为 以 下 4 个 方法 。 

Field getField() 一 一 获得 命名 的 公共 字段 。 

Field[ jgetFields() 一 一 获得 类 的 所 有 公共 字段 。 

Field getDeclaredField() 一 一 获得 类 声明 的 命名 的 字段 。 
Field[ jgetDeclaredFields() 一 一 获得 类 声明 的 所 有 字段 。 
观察 代码 getField() 方 法 实现 结构 图 ,如 图 4.8 所 示 。 


getField 方 法 主要 实现 getField 
了 一 一 获得 命名 的 公 
共 字段 1 

getPublicFieldRecursive Java 方 法 

1 
getDeclaredField 

-一 | 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 人 调用 
位 于 vm 文件 Fnative | Dalvik_ java_lang_Class_getDecl :五 
文件 夹 aredField 富丽 数 
CO YE 本 出 闪光 
上 十 调用 功能 
ve dvmGetDeclaredField 函数 


图 4.8 getField() 方 法 实现 结构 图 


getFields() 方 法 的 实现 结构 图 ,如 图 4.9 所 示 。 
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getFields 方 法 主要 实 
现 了 一 一 获得 所 有 公 
共 字段 


位 于 vm 文件 下 native 
文件 夹 

位 于 vm 文件 夹 下 
reflect 文 件 


getFields 


1 


getPublicFieldsRecursive 


Java 方 法 


1 


getDeclaredFields 


aredFields 


Dalvik java lang Class_getDecl C 语 言 函数 


dvmGetDeclaredFields 


4.9 ”getFields() 方 法 的 实现 结构 图 


获取 类 中 字段 信息 的 这 组 接口 的 实现 原理 与 结构 和 构造 函数 一 样 ,都 是 通过 调用 本 
地 方法 完成 其 方法 功能 。 通 过 对 另外 两 个 方法 getDeclaredField() 和 getDeclaredFields() 
绘制 流程 图 并 归纳 总 结 发 现 上 层 接口 与 底层 具体 实现 函数 有 如 下 对 应 关系 ,如 图 4. 10 


所 示 。 


getField 


上 一 dvmGetDeclaredField 


getDeclaredField H 


getFields | 


上 一 | dvmGetDeclaredFields 


getDeclaredFields | 


4.10 字段 相关 的 对 应 关系 图 


从 图 4. 10 可 以 知道 ,Class 类 中 用 于 获得 字段 信息 的 4 个 反射 方法 分 别 对 应 底层 的 两 
个 实现 函数 ,和 获取 构造 函数 信息 的 情形 相同 ,这 里 涉及 的 两 个 底层 执行 函数 会 在 报告 的 
“关键 函数 详细 分 析 ” 部 分 中 进行 详细 分 析 。 
至 此 ,本 节 完 成 了 对 Class 类 中 所 涉及 的 三 组 12 个 反射 方法 的 实现 原理 以 及 实现 流程 


架构 的 分 析 。 


4.5.2 ”Constructor 类 详细 分 析 


Constructor 类 提供 关于 类 的 单个 构造 方法 的 信息 以 及 对 它 的 访问 权限 。 其 中 最 关键 
的 方法 是 newInstance() ,用 于 调用 相关 联 的 构造 函数 实例 化 一 个 类 对 象 。 报 告 主 要 对 这 个 
方法 的 实现 机 理 进行 分 析 并 展示 其 实现 流程 。 

首先 通过 该 方法 的 实现 结构 图 了 解 一 下 它 的 实现 机 理 , 如 图 4. 11 所 示 。 

从 图 4. 11 中 可 以 看 到 这 个 newInstance() 方 法 实际 上 在 取得 入 口 参数 之 后 立即 返回 调 
用 本 地 接口 constructNative, 由 此 过 渡 到 虚拟 机 内 部 执行 ,在 虚拟 机 内 部 可 以 发 现 本 地 方法 
随后 调用 了 dvmInvokeMethod 函数 去 执行 该 构造 方法 。 至 此 .完成 了 实例 化 一 个 对 象 的 工 
作 。 这 里 需要 指出 的 是 ,dvmInvokeMethod 函数 实际 是 属于 解释 器 范畴 ,本 书 就 不 再 详 述 。 
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newlnstance 方 法 主要 | newmstance ”| Java 方 法 
实现 了 有 构造 函 
数 实例 化 一 个 对 象 实 1 
例 constructNative 
一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 | JNI 调 用 
位 于 vm 文 件 下 native Dalvik java lang reflect_ C 语 言 函 数 
文件 夹 Constructor_constructNative 人 
a ee 
调用 功 和 
和 下 dvmInvokeMethod 函数 四 


4.11 newInstance 方法 实现 结构 图 


4.5.3 ”Method 类 详细 分 析 


Method 类 提供 关于 类 或 接口 上 单独 某 个 方法 的 信息 。 所 反映 的 方法 可 能 是 静态 方法 
或 虚拟 方法 , 它 是 用 来 封装 反射 类 方法 的 一 个 类 。 此 类 中 最 重要 的 方法 为 invoke, 它 的 主要 
作用 是 通过 反射 机 制 激活 一 个 静态 或 虚拟 方法 。 此 函数 具体 的 实现 结构 如 图 4. 12 所 示 。 


invoke 方 法 主要 实现 a Java 方 法 
了 一 一 激活 一 个 方法 T 
invokeNative 

ee | JNI 调 用 
位 于 vm 文件 下 native Dalvik_java_lang_reflect_ i 
文件 夹 Method_invokeNative C 语 言 函数 
0 re 本 地 方法 

1 3 调用 功能 
ER dvminvokeMethod 函数 


4.12 invoke 方法 实现 结构 图 


结合 代码 和 结构 图 可 以 得 知 ,invoke 方法 首先 需要 取得 入 口 参数 ,然后 调用 本 地 接口 
invokeNative, 运 用 JNI 机 制 将 Java 方法 转换 为 C 语言 函数 ,将 该 方法 转换 到 虚拟 机 内 部 执 
行 。 本 地 方法 Dalvik _ java _ lang _ reflect Method _ invokeNative 随后 调用 了 
dvmInvokeMethod 函数 将 方法 激活 。 综 上 所 述 ,invoke() 方 法 就 是 这 样 通过 类 反射 机 制 将 
一 个 静态 或 虚拟 的 方法 激活 的 。 


4.5.4 Field 类 详细 分 析 


Field 类 提供 有 关 类 或 接口 的 属性 的 信息 ,以 及 对 它 的 动态 访问 权限 。 反 射 的 字段 可 能 
是 一 个 静态 或 动态 字段 ,简单 的 理解 可 以 把 它 看 成 一 个 封装 反射 类 的 属性 的 类 。 此 类 中 相 
对 重要 的 方法 是 get() 方 法 以 及 set() 方 法 ,下 面 分 析 一 下 这 两 个 方法 的 具体 实现 过 程 。 

首先 本 文 先 分 析 get() 方 法 ,此 方法 主要 的 功能 是 获得 目标 字段 的 值 并 且 进 行 封装 ,此 
函数 的 具体 流程 如 图 4. 13 所 示 。 

结合 代码 和 流程 图 可 以 看 出 ,get() 方 法 获得 入 口 参数 之 后 直接 调用 本 地 接口 getField， 
运用 JNI 机 制 将 上 层 的 Java 方法 转换 为 C 语言 函数 ,将 该 方法 转换 到 虚拟 机 内 部 执行 。 本 
地 方法 Dalvik_java_lang_reflect_Field_getField 的 主要 功能 是 将 一 个 原始 字段 进行 封装 并 
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且 获 得 其 中 的 值 ,在 这 里 只 简单 描述 该 函数 的 流程 ,具体 分 析 将 在 后 文中 的 函数 详细 分 析 部 
分 进行 介绍 。 本 函数 的 人 口 参数 args 为 一 个 常量 ,pResult 为 虚拟 机 参数 。 该 函数 首先 定 
义 了 所 需要 的 相关 变量 , 接 下 来 函数 并 没有 直接 获得 字段 中 的 值 , 而 是 先 调用 
validateFieldAccess 函数 ,来 验证 字段 是 否 可 访问 并 且 返 回 一 个 指向 结构 体 的 字段 field。 
在 获得 函数 validateFieldAccess 返回 的 字段 指针 field 之 后 , 主 函 数 对 该 指针 进行 非 空 判 
断 ,如 果 field 不 为 空 , 则 函数 调用 getFieldValue 函数 。 


人 能 是 获 get Java 方 法 
1 


getField 


位 于 vm 文件 夹 下 native Dalvik java_lang reflect_ 语言 
文件 Field_getFicld C 语 言 函数 


| 


getFieldValue 


4.13 ”get() 方 法 实现 流程 图 


getFieldValue 函数 虽然 很 简短 ,但 它 却 是 实现 提取 字段 值 的 关键 函数 ,同样 也 是 get() 
方法 实现 的 核心 函数 ,结合 代码 能 更 清晰 地 了 解 此 函数 的 工作 流程 。getFieldValue 函数 首 
先 判 断 该 字段 是 静态 字段 还 是 实例 字段 ,然后 通过 调用 getStaticFieldValue 和 
getInstFieldValue 函数 分 别 将 静态 字段 和 实例 字段 的 值 提取 出 来 。 在 getFieldValue 函数 
结束 后 本 地 函数 Dalvik_java_lang_reflect_Field_getField 调用 dvmBoxPrimitive 函数 将 字 
段 进行 封装 ,然后 赋 给 result。 调 用 dvmReleaseTrackedAlloc 函数 ,停止 跟踪 这 个 对 象 。 返 
回 刚刚 获得 的 封装 好 的 数据 对 象 result。 到 此 ,get() 方 法 就 完整 地 实现 了 提取 字段 值 的 
功能 。 

接 下 来 分 析 set() 方 法 ,此 方法 主要 的 功能 是 从 一 个 已 经 被 封装 好 的 字段 中 提取 值 , 此 
函数 的 具体 流程 如 图 4. 14 所 示 。 


这 帮主 主要 功能 中 Javi 方 法 
setField 

i 

RT| i | cma 
setFieldValue 


4.14 ”set() 方 法 实现 流程 图 


结合 代码 和 流程 图 可 以 看 出 ,set() 方 法 获得 入 口 参数 之 后 直接 调用 本 地 借口 setField， 
运用 JNI 机 制 将 上 层 的 Java 方法 转换 为 C 语言 函数 ,将 该 方法 转换 到 虚拟 机 内 部 执行 。 本 
地 方法 Dalvik_java_lang_reflect_Field_setField 的 主要 功能 是 获得 一 个 封装 好 的 原始 字段 
中 的 值 ,在 这 里 只 简单 描述 该 函数 的 流程 ,具体 分 析 将 在 后 文中 的 函数 详细 分 析 部 分 进行 介 
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绍 。 此 函数 入 口 参 数 args 为 一 个 常量 ,pResult 为 虚拟 机 参数 。 该 函数 首先 定义 了 所 需要 
的 相关 变量 ,随后 调用 dvymUnboxPrimitive 函数 ,这 个 函数 的 功能 是 打开 一 个 已 经 封装 的 
原始 类 型 ,具体 函数 与 本 方法 关系 不 大 ,在 这 里 就 不 做 介绍 了 。 

在 打开 封装 之 后 ,函数 调用 validateFieldAccess 函数 进行 访问 验证 ,获得 一 个 字段 指针 
field。 对 field 进行 非 空 判 断 ,如 果 不 为 空 则 调用 setFieldValue 函数 。setFieldValue 函数 首先 
判断 该 字段 是 静态 字段 还 是 实例 字段 ,然后 调用 setStaticFieldValue 和 setInstFieldValue 也 数 
将 值 配 置 到 相应 类 型 的 字段 中 。setFieldValue 函数 是 set() 方 法 中 较为 核心 的 部 分 。 

至 此 ,set() 方 法 完成 了 它 的 主要 功能 ,成 功 地 打开 了 一 个 封装 好 的 原始 字段 并 配置 相 
关 字 段 。 


4.5.5 反射 机 制 对 Proxy 类 和 Annotation 类 功能 上 的 支持 


首先 ,已 经 明确 动态 代理 和 元 数据 注释 两 种 机 制 是 建立 在 反射 机 制 的 实现 原理 之 上 , 因 
此 本 书 主要 围绕 两 种 机 制 在 虚拟 机 内 部 的 具体 实现 进行 介绍 ,不 对 上 层 的 API 进行 分 析 。 

本 书 首先 对 两 种 机 制 中 的 各 个 接口 进行 了 分 析 , 归 纳 分 析 了 其 中 的 各 个 本 地 方法 接口 ， 
得 到 的 结果 是 : 这 两 种 机 制 也 是 遵循 "三 个 层次 ”这 一 实现 结构 。 但 两 种 机 制 的 底层 实现 函 
数 并 没有 封装 在 虚拟 机 源码 中 的 reflect. cpp 中 ,而 是 分 别 存 在 于 Proxy. cpp 和 
Annotation. cpp 文件 中 ,这 三 个 文件 统一 存放 在 虚拟 机 源码 的 reflect 文件 夹 下 ,因此 ,再 次 
印证 了 本 文 之 前 的 分 析 一 一 即 这 两 种 机 制 确实 是 依托 于 反射 机 制 而 设计 的 ,通过 对 源码 的 
简单 分 析 发 现 这 两 种 机 制 在 对 相关 类 信息 的 处 理 上 ,所 用 到 的 方法 思路 和 反射 机 制 非常 
相似 。 


4.5.6 核心 函数 详细 分 析 
1. Dalvik_java_lang_reflect_Method_invokeNative 函数 详细 分 析 


函数 流程 图 如 图 4. 15 所 示 。 

本 函数 是 Method 类 封装 的 invoke 方法 的 具体 实现 , 它 的 重要 功能 是 在 通过 反射 机 制 
获取 一 个 方法 后 去 激活 使 用 这 个 方法 ,使 Java 程序 的 灵活 性 大 大 提高 。 本 函数 的 入口 参数 
比较 多 ,因此 ,主要 介绍 一 下 几 个 关键 的 参数 以 及 中 间 变 量 。 首 先是 Object * methObj 一 一 
目标 对 象 .ClassObject * declaringClass 目标 方法 所 属 的 类 对 象 ,int slot 方法 在 类 
方法 表 中 的 序号 以 及 Method* meth 方法 指针 。 

主 函 数 首先 调用 dvmSlotToMethod 函数 根据 slot 变量 获取 该 目标 方法 在 类 对 象 方法 
区 中 的 位 置 ,并 将 这 个 方法 返回 给 方法 指针 meth。 至 此 ,此 函数 完成 取 到 方法 的 工作 。 

主 函 数 随 后 便 将 对 这 个 方法 进行 一 系列 判断 ,首先 是 判断 该 方法 是 否 为 静态 方法 ,如 果 
是 , 则 判断 相应 的 类 是 否 被 加 载 且 被 初始 化 ,在 初始 化 后 将 该 方法 的 指针 meth 直接 交付 给 
dvmInvokeMethod 函数 执行 ,否则 将 首先 对 所 属 类 进行 进一步 判断 ,判断 其 是 否 为 一 个 接 
口 ,如 是 则 加 载 并 初始 化 这 个 接口 ,如 果 该 所 属 类 不 是 一 个 接口 , 则 进行 下 一 步 又 ;判断 
methObj 一 一 目标 对 象 是 否 为 预期 的 所 属 类 的 一 个 实例 对 象 , 随 后 , 主 函 数 将 会 查找 这 个 方 
法 的 准确 入 口 ,并 将 正确 的 方法 入 口 赋值 给 meth 指针 ,最 后 将 该 方法 的 指针 meth 直接 交 
付 给 dvmInvokeMethod 函数 执行 。 主 函数 到 这 已 经 取得 了 正确 的 方法 指针 meth, 因 此 ,将 
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调用 dvmInvokeMethod 函数 对 取得 的 方法 解释 执行 ,并 将 结果 返回 给 result。 
至 此 ,完成 了 对 本 地 方法 Dalvik_java_lang_reflect_Method_invokeNative 函数 的 分 析 。 


调 月 
dvmlsStaticMethod 


区 中 交流 方法 是 为 
了 
获得 入 口 参数 
调用 
So 调用 dvmLsInterfaceClass 
PResult dvmInitClass 函数 判断 对 象 是 否 为 一 个 
函数 对 该 类 进行 预期 的 实例 关 是 
1 初始 化 ~ 
调用 
dvmSlotToMethod | | 
函数 获取 方法 调用 调 
位 置 dvmVerifyObjectInClass | -| dvmInitClass 
函数 判断 对 象 是 否 为 一 函数 对 该 类 进行 
个 预期 的 实例 类 初始 化 
1 
调用 
dvmGetVirtualized 
Method 函 数 查找 该 
方法 
1 
调用 
-一 dvmInvokeMethod 
完成 对 方法 的 激活 


4.15 Dalvik_java_lang_reflect_Method_invokeNative 函数 流程 图 


2. Dalvik_java_lang_reflect_Proxy_generateProxy 详细 分 析 
函数 流程 图 如 图 4. 16 所 示 。 


一 一 | dvmGenerateProxyClass 
函数 产生 Proxy 类 
获得 入 口 参数 
Const u4* args, 
JValue* pResult 释放 中 间 变 量 
声明 相应 的 中 间 变量 结束 


4.16 Dalvik_java_lang_reflect_Proxy_generateProxy 函数 流程 图 


本 函数 是 实现 代理 机 制 的 重 中 之 重 , 用 于 产生 代理 类 ,代码 比较 清晰 明了 , 先 观察 一 下 代码 。 
代码 清单 4.7 dalvik\vm\native\ java_lang_reflect_Proxy. cpp 


Static void Dalvik java lang reflect Proxy generateProxy(omst u4* args, 


106 


JValuex FEesult) 


Stringcbject* str= (Stringabjectx ) args[0]; 


ArrayObject * interfaces= (ArrayObject* ) args[1]; 


Gbject* loader= (Cbject* ) args[2]; 


Classcbject* result; 


result= dvmGenerateProxyClass (str, interfaces, loader); 


RETURN PTR (result)7 
} 


Android Dalvik 虚拟 机 结构 及 机 制 训 析 一 一 第 2 卷 Dalvik 虚拟 机 各 模块 机 制 分 析 


主 函 数 首 先 声明 了 变量 用 于 接收 入 口 参数 , 主 函 数 通 过 调用 dvmGenerateProxyClass 
函数 完成 产生 一 个 Proxy 类 并 将 结果 返回 给 result。 


至 此 ,该 函数 的 分 析 结 束 。 


3. Dalvik_java_lang_reflect_Field_getField 详细 分 析 


函数 流程 图 如 图 4. 17 所 示 。 


获得 入 口 参数 
Const u4* args, 
JValue* pResult 


调用 
getFieldValue 
进行 赋值 


1 


声明 内 部 变量 Object* obj 、 
ClassObject* declaringClass 、 
ClassObject* fieldType 、 int 
Slot 、bool noAccessCheck 


用 于 接收 入 口 参数 


调用 

dvmBoxPrimitive 

函数 将 原始 类 型 
进行 封装 


了 


validateFieldAccess 


释放 中 间 变量 


有 


返回 程序 结果 


result 


函数 得 到 一 个 字段 
指针 field 


4.17 Dalvik_java_lang_reflect_Field_getField 函数 流程 图 


本 函数 的 主要 功能 是 将 一 个 原始 字段 进行 封装 。 本 函数 的 入口 参数 args 为 一 个 常量 ， 
pResult 为 虚拟 机 参数 。 进 入 主 函 数 体 , 首 先 函 数 将 入 口 参数 args 转换 成 Object 类 的 指针 
变量 并 赋值 给 obj ,再 将 args 转换 成 ClassObject 类 的 指针 变量 并 赋值 给 declaringClass, 接 
下 来 按 同 样 的 方法 将 变量 分 别 转换 成 相应 的 类 型 分 别 赋值 给 fieldType、slot、 
noAccessCheck。 之 后 函数 体 定义 了 一 个 字段 指针 field, value 为 虚拟 机 参数 ,定义 了 一 个 
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数据 对 象 指针 为 result。 

接 下 来 函数 调用 validateFieldAccess 函数 ,这 个 函数 是 用 来 验证 访问 字段 并 且 返 回 一 
个 指向 结构 体 的 字段 field。 在 获得 函数 validateFieldAccess 返回 的 字段 field 之 后 , 主 函 数 
对 field 进行 非 空 判断 。 随 后 调用 getFieldValue 函数 ,此 函数 会 将 刚刚 获得 并 判断 是 否 为 
空 的 字段 中 的 值 赋 给 value。 最 后 函数 调用 dvmBoxPrimitive 函数 将 字段 进行 封装 ,然后 赋 
给 result。 调 用 dvmReleaseTrackedAlloc 函数 ,停止 跟踪 这 个 对 象 。 返 回 刚 刚 获 得 的 封装 
好 的 数据 对 象 result。 

至 此 ,完成 了 对 函数 Dalvik_java_lang_reflect_Field_getField 的 详细 分 析 。 


4. Dalvik_java_lang_reflect_Field_setField 详细 分 析 


函数 流程 图 如 图 4. 18 所 示 。 


能 否 调用 
dvmUnboxPrimitive 函 数 将 
封装 好 的 类 打开 ? 


(GF ) 始 调用 
validateFieldAccess 
函数 得 到 一 个 字段 否 
1 指针 field 
获得 入 口 参 数 
Const u4* args, 
JValue* pResult 


调用 
dvmThrowlllegalArgument 
Exception 抛 出 异常 


1 
声明 相关 变量 是 


4.18 ”Dalvik_java_lang_reflect_Field_setField 函数 流程 图 


本 函数 的 主要 功能 是 获得 一 个 封装 好 的 原始 字段 中 的 值 。 本 函数 的 人口 参数 args 为 
一 个 常量 ,pResult 为 虚拟 机 参数 。 进 入 主 函 数 体 , 首 先 函数 将 入 口 参数 args 转换 成 Object 
类 的 指针 变量 并 赋值 给 obj, 再 将 args 转换 成 ClassObject 类 的 指针 变量 并 赋值 给 
declaringClass , 接 下 来 按 同 样 的 方法 将 变量 分 别 转换 成 相应 的 类 型 分 别 赋值 给 fieldType、 
slot\noAccessCheck。 之 后 函数 体 定义 了 一 个 字段 指针 field, value 为 虚拟 机 参数 ,定义 了 
一 个 数据 对 象 指 针 为 result。 

将 所 有 变量 定义 完成 之 后 , 主 函 数 首 先进 行 判 断 , 调 用 dvmUnboxPrimitive 函数 将 封 
装 好 的 原始 类 型 打开 , 如 果 正 常 打 开 则 函数 正常 运行 , 如果 打 开 失 败 则 函数 调用 
dvmThrowlllegalArgumentException 抛 出 非法 参数 异常 。 

打开 封装 好 的 类 之 后 再 调用 validateFieldAccess 函数 ,这 个 函数 是 用 来 验证 访问 字段 
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并 且 返 回 一 个 指向 结构 体 的 字段 field。 在 获得 函数 validateFieldAccess 返回 的 字段 field 
之 后 主 函数 对 field 进行 非 空 判断 。 如 果 返 回 的 字段 field 不 为 空 值 , 则 调用 setFieldValue 
函数 将 得 到 的 字段 的 值 返 回 。 这 样 就 成 功 地 将 一 个 封装 好 的 字段 中 的 值 提取 出 来 了 。 

至 此 ,完成 了 对 函数 Dalvik_java_lang_reflect_Field_setField 的 详细 分 析 。 


5. dvmFindClassByName 详细 分 析 


函数 流程 图 如 图 4. 19 所 示 。 


空 
调 月 1 
dexIsValidClassName 1 
函数 完成 对 类 名 的 的 生 人 
合法 性 检验 
调 goto bail 进 入 
上:: 入 
开始 dvmDotToDescriptor 蜡 珊 处 加 
描述 符 的 
化 
得 到 入 口 参数 
StringObject* nameObj, 调用 
Object* loader, - Fal ， 
bool doInit Wdolnits | vm indC essNol nit 
i 但 不 将 其 初始 化 
对 nameObj 变 量 调用 dvmFindClass 
做 非 空 判断 函数 对 类 进行 查找 
并 初始 化 
作 空 
调用 和 结果 返回 给 
dvmCreateCstrFromString i 人 
函数 完成 类 名 的 转换 
结束 


4. 19 dvmFindClassByName 函数 流程 图 


经 过 JNI 的 过 渡 作 用 ,虚拟 机 内 的 dvmFindClassByName 函数 是 静态 Java 方法 Class. 
forName 的 底层 实现 函数 ,下 面 对 这 个 函数 进行 详细 的 实现 分 析 。 

首先 分 析 一 下 本 函数 人口 参数 StringObject x nameObj 一 一 目标 类 类 名 (但 在 虚拟 机 
运行 时 不 是 一 个 string 类 型 的 字符 串 )，Object * loader 指定 的 类 加 载 器 , bool 
doInit 一 个 布尔 类 型 的 标示 位 ,告诉 虚拟 机 是 否 要 对 所 找 的 类 进行 初始 化 。 

进入 函数 体 后 , 主 函 数 dvmFindClassByName 首先 对 目标 类 类 名 做 非 空 判断 ,随后 完成 类 
名 的 字符 型 转化 , 主 函数 通过 调用 dvmCreateCstrFromString 函数 完成 类 名 的 转化 并 将 这 个 字 
符 型 类 名 赋值 给 一 个 char 型 变量 name。 在 对 类 名 进行 转化 后 , 主 函 数 将 会 对 这 个 类 名 进行 验 
证 ,并 且 对 它 的 格式 进行 转化 (从 x. y.z 到 x/y/z) ,通过 调用 dexIsValidClassName 完成 类 名 正 
确 性 的 验证 并 通过 调用 dvmDotToDescriptor 函数 完成 格式 的 转化 ,并 将 转化 后 的 类 描述 符 赋 
值 给 descriptor 变量 。 

主 函 数 到 这 里 就 要 开始 它 的 主要 工作 了 一 一 根据 一 个 正确 的 类 描述 符 找 到 并 加 载 这 个 
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类 。 随 后 主 函数 会 判断 前 面 提 到 的 布尔 类 型 的 标示 位 一 一 提示 是 否 要 对 加 载 好 的 类 进行 初 
始 化 ,如 果 要 求 做 初始 化 主 函 数 会 调用 dvmFindClass 函数 (这 个 函数 会 根据 描述 符 找到 并 
加 载 ,随后 便 对 这 个 加 载 好 的 类 进行 初始 化 ) ,否则 就 会 调用 dvmFindClassNoInit( 它 的 功能 
与 dvmFindClass 函数 相近 ,只 是 不 会 对 类 进行 初始 化 )。 它 们 的 返回 值 都 是 一 个 类 对 象 实 
例 clazz。 

到 这 里 , 主 函 数 将 会 开始 收尾 工作 ,会 对 clazz 变量 做 非 空 判断 : 如 果 为 空 , 则 证 明 查 找 
加 载 失败 ,虚拟 机 会 打出 日 志 并 抛 出 异常 信息 ;如 果 非 空 , 则 表示 运行 正确 ,打印 日 志 并 返回 
clazz 对 象 。 

至 此 ,完成 了 dvmFindClassByName 函数 的 详细 分 析 ,具体 的 实现 流程 很 清晰 ,其 中 涉 
及 的 一 些 具体 的 功能 点 函数 就 不 在 本 报告 中 再 做 讨论 。 


6. dvmGetDeclaredConstructorOrMethod 详细 分 析 
函数 流程 图 如 图 4. 20 所 示 。 


开始 


调用 findConstructorOrMethodInArray 函 


下 数 提取 相关 方法 并 将 结果 赋值 给 result 


ClassObject* clazz, 
StringObject* nameObj, 
ArrayObject* args 


1 
调用 函数 
dexStringCacheInit 
对 dX 件 池 符 由 调 到 
容器 进行 初始 化 findConstructorOrMethodInArray 
函数 入 口 参 数 再 次 提取 

调用 函数 相关 方法 
dvmCreateCstrFromString 结束 
将 目标 方法 的 名 转化 为 
字符 串 


对 result 做 非 空 
判断 


释放 中 间 变 量 
并 返回 结果 


调用 
createTargetDescriptor 


函数 生成 目标 方法 描述 符 


图 4. 20 dvmGetDeclaredConstructorOrMethod 函数 流程 图 


本 函数 是 静态 Java 方法 Class. getDeclaredConstructorOrMethod 的 底层 实现 函数 , 它 
的 主要 功能 是 根据 一 个 指定 的 方法 名 将 这 个 方法 从 一 个 类 对 象 取出 并 返回 给 一 个 方法 
对 象 。 

首先 ,看 下 它 的 入 口 参 数 ,ClassObject * clazz 一 个 类 对 象 实例 , StringObject * 
nameObj 一 一 目标 方法 名 , ArrayObject * args 相关 参数 。 

进入 函数 体 , 主 函 数 首先 声明 一 个 Object 类 型 的 指针 ,用 于 返回 保存 取得 的 方法 ,随后 
声明 一 个 DexStringCache 类 型 的 结构 体 实例 targetDescriptorCache, 用 来 封装 Dex 文件 的 
一 些 字符 串 信 息 并 且 还 会 声明 两 个 char 型 变量 name 以 及 targetDescriptor, 它 们 的 作用 在 
后 文 会 点 出 。 
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进行 相关 变量 的 声明 后 , 主 函 数 调 用 dexStringCacheInit 函数 对 前 面 声 明 的 
targetDescriptorCache 进行 初始 化 ,随后 便 调用 函数 dvmCreateCstrFromString 函数 将 目 
标 方法 的 名 转化 为 字符 串 并 赋值 给 name 变量 ,在 取得 name 名 后 主 函 数 调 用 
createTargetDescriptor 函数 根据 目标 方法 的 参数 生成 目标 方法 的 描述 符 ,并 将 结果 装 入 
DexStringCache 类 型 的 结构 体 实例 targetDescriptorCache, 随 后 便 将 targetDescriptorCache 
对 象 的 一 个 成 员 变 量 value 赋值 给 前 面 声明 的 targetDescriptor。 运 行 到 这 , 主 函 数 将 要 对 
方法 进行 提取 ,通过 调用 findConstructorOrMethodInArray 函数 再 结合 前 面 产生 的 各 类 目 
标 方法 的 信息 在 类 对 象 中 查找 并 提取 相关 的 方法 ,如 果 运 行 正 常 将 方法 返回 给 result 变量 。 

至 此 ,dvmGetDeclaredConstructorOrMethod 函数 的 详细 分 析 结 束 。 


7. dvmGetDeclaredMethods 函数 详细 分 析 


函数 流程 图 如 图 4. 21 所 示 。 


(开始 ) 3 
通过 一 个 任 环 结构 并 且 调 用 


| dvmSetObjectArrayElement 
| 获得 入 口 参数 函数 将 类 中 的 所 有 方法 填 入 
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virtual MethodsdirectMethods 空 值 变量 

数目 进行 统计 
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dvmAllocArrayByClass ”| 一 
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4.21 dvmGetDeclaredMethods 函数 流程 图 


经 过 JNI 的 过 渡 作 用 ,虚拟 机 内 的 dvmGetDeclaredMethods 函数 是 静态 Java 方法 
getDeclaredMethods 的 底层 实现 函数 ,下 面 对 这 个 函数 进行 详细 的 实现 分 析 。 

首先 对 函数 的 入口 参数 进行 分 析 : ClassObject x clazz 表示 一 个 已 经 加 载 到 内 存 中 的 
类 对 象 , bool publicOnly 表示 是 否 为 public 类 型 。 进 入 函数 体 后 , 主 函 数 首先 对 系统 类 
classJavaLangReflectMethod 进行 初始 化 。 

主 函 数 随 后 对 声明 的 方法 进行 统计 ,但 虚拟 机 将 virtual Miranda methods 和 direct 
class/object constructors 等 方法 忽略 。 主 函数 首先 将 方法 计数 器 count 清 零 ,随后 获取 类 
对 象 方法 区 指针 , 接 下 来 顺 次 对 类 中 的 方法 进行 判断 , 主 函 数 在 这 里 利用 一 个 循环 结构 完成 
对 方法 的 遍历 。 

主 函 数 到 这 里 将 会 生成 一 个 方法 数组 methodArray, 用 来 保存 从 类 对 象 中 取 到 的 方法 。 
随后 主 函 数 将 要 “填写 ”这 个 方法 数组 ,也 就 是 将 声明 的 方法 都 保存 到 这 个 方法 数组 中 ,依然 
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忽略 virtual Miranda methods 和 direct class/object constructors 等 方法 ,具体 的 读 入 流程 
如 下 : 主 函 数 首先 调用 dvmCreateReflectMethodObject 函数 生成 方法 对 象 实例 methObj， 
随后 主 函 数 调 用 dvmSetObjectArrayElement 函数 将 当前 方法 读 入 本文 在 前 面 声 明 的 方法 
数组 methodArray, 最 后 主 函 数 调 用 dvmReleaseTrackedAlloc 释放 掉 用 来 保存 方法 的 中 间 
对 象 methObj。 这 样 就 完成 了 将 类 对 象 中 的 一 个 方法 保存 到 方法 数组 中 , 主 函 数 在 这 里 用 
到 了 循环 结构 ,实现 了 对 封装 在 类 对 象 中 所 有 方法 的 遍历 。 以 上 是 对 类 对 象 中 的 虚 方法 进 
行 录入 保存 的 过 程 ,对 直接 方法 的 处 理 方式 完全 一 样 ,就 不 再 闭 述 。 

最 后 主 函 数 将 要 进行 收尾 工作 , 它 会 检查 是 否 已 经 将 类 对 象 中 的 全 部 方法 全 部 遍历 ,如 
果 正 常 则 返回 方法 数组 ,否则 释放 已 经 获取 的 方法 数组 。 


8. dvmGetDeclaredConstructors 详细 分 析 


函数 流程 图 如 图 4. 22 所 示 。 
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sisal ngRollect Constrictdt 否 构造 函数 取出 ? 
进行 初始 化 
1 
主 函数 对 相关 方法 进行 抛 出 异常 ， 返 回 | -| 释放 中 间 
数量 统计 空 值 变量 


4.22 dvmGetDeclaredConstructors 函数 流程 图 


经 过 JNI 的 过 渡 作 用 ,虚拟 机 内 的 dvmGetDeclaredConstructors 函数 是 静态 Java 方法 
getConstructors ,getDeclaredConstructors 的 底层 实现 函数 ,下 面 对 这 个 函数 进行 详细 的 实 
现 分 析 。 

首先 对 函数 的 人 人 口 参数 进行 分 析 : ClassObject * clazz 表示 一 个 已 经 加 载 到 内 存 中 的 
类 对 象 , bool publicOnly 表示 是 否 为 public 类 型 。 进 入 函数 体 后 , 主 函 数 首先 对 系统 类 
classJavaLangReflectConstructor 进行 初始 化 。 

主 函 数 首先 将 方法 计数 器 count 清 零 ,随后 获取 类 对 象 构 造 方法 区 指针 , 接 下 来 顺 次 对 
类 中 的 所 有 方法 进行 判断 , 主 函数 在 这 里 利用 一 个 循环 结构 完成 对 方法 构造 方法 以 及 静态 
方法 的 遍历 。 

下 一 步 主 函数 会 生成 一 个 数组 ctorArray, 用 来 保存 从 类 对 象 中 取 到 的 构造 方法 。 在 构 
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造 函 数 数组 生成 好 之 后 主 函数 遍历 所 有 构造 方法 ,将 满足 条 件 的 字段 填 和 人 上 一 阶段 生成 好 
的 字段 数组 ctorArray 中 。 函 数 的 具体 填 入 流程 如 下 : 首先 调用 createConstructorObject 
生成 一 个 构造 方法 对 象 ,然后 判断 是 否 为 空 , 如 果 为 空 则 调用 dvmReleaseTrackedAlloc 函 
数 停止 跟踪 并 返回 空 值 ; 如 果 不 为 空 则 调用 dvmSetObjectArrayElement 函数 将 当前 构造 方 
法 存 人 数组 ctorArray 中 ,最 后 程序 调用 dvmReleaseTrackedAlloc 函数 释放 中 间 对 象 
ctorObj。 通 过 循环 结构 实现 了 将 所 有 满足 条 件 的 构造 方法 全 部 填 人 到 数组 ctorArray 中 。 

最 后 主 函 数 检查 构造 函数 数组 ctorArray 长 度 是 否 等 于 构造 函数 对 象 的 数量 
ctorObjCount, 如 果 相 等 就 说 明 已 经 遍历 了 所 有 构造 函数 ,此 时 程序 返回 获得 的 构造 函数 数 
组 ctorArray。 

至 此 ,完成 了 对 dvmGetDeclaredConstructors 函数 的 详细 分 析 。 


9. dvmGetDeclaredFields 函数 详细 分 析 


函数 流程 图 如 图 4. 23 所 示 。 


始 
Ca Er 
1 ~ dvmSetObjectArrayElement 
获得 入 口 参数 函数 将 类 中 的 所 有 字段 填 入 
ClassObject* clazz, 到 字段 数组 中 


bool publicOnly 


| 
主 函 数 首先 对 系统 类 是 否 已 经 将 所 有 的 
classJavaLangReflectField 字段 取出 ? 
进行 初始 化 
1 i 
主 函数 会 分 别 对 sfield 和 抛 出 异常 返回 | __| 释放 中 间 
ifield 数 目 进行 统计 空 值 变量 


凤 


dvmAllocArrayByClass “ 广 一 
函数 产生 一 个 字段 数组 


4.23 dvmGetDeclaredFields 函数 流程 图 


经 过 JNI 的 过 渡 作 用 ,虚拟 机 内 的 dvmGetDeclaredFields 函数 是 静态 Java 方法 
getDeclaredFields 和 getFields 的 底层 实现 函数 ,下 面 对 这 个 函数 进行 详细 的 实现 分 析 。 

首先 对 函数 的 入 口 参数 进行 分 析 : ClassObject * clazz 表示 一 个 已 经 加 载 到 内 存 中 的 
类 对 象 , bool publicOnly 表示 是 否 为 public 类 型 。 

进入 函数 体 后 , 主 函 数 首 先 对 系统 类 classJavaLangReflectField 进行 初始 化 。 

函数 首先 定义 一 个 计数 器 来 统计 字段 的 数量 。 首 先 判断 是 否 为 public 类 型 ,然后 利用 
两 个 循环 体 分 别 统计 实例 字段 和 静态 字段 的 数量 。 实 例 字 段 和 静态 字段 之 和 就 是 count 
值 , 它 在 下 一 阶段 就 作为 生成 的 字段 数组 的 长 度 。 

主 函 数 到 这 里 将 会 生成 一 个 字段 数组 fieldArray, 用 来 保存 从 类 对 象 中 取 到 的 字段 。 
在 字段 数组 生成 好 之 后 主 函数 遍历 所 有 字段 ,将 满足 条 件 的 字段 填 和 人 上 一 阶段 生成 好 的 字 
段 数组 fieldArray 中 。 函 数 的 具体 的 填 入 流程 如 下 : 函数 首先 调用 createFieldObject 生成 
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一 个 字段 对 象 , 然 后 判断 是 否 为 空 字段 ,如 果 为 空 则 释放 所 有 数组 ;如 果 不 为 空 则 调用 
dvmSetObjectArrayElement 函数 将 当前 字段 存 人 字段 数组 fieldArray 中 ,最 后 程序 调用 
dvmReleaseTrackedAlloc 函数 释放 中 间 对 象 field。 通 过 循环 结构 实现 了 将 所 有 满足 条 件 
的 静态 字段 全 部 填 人 到 字段 数组 fieldArray 中 。 

在 存储 实例 字段 时 所 运用 的 方法 与 静态 字段 完全 相同 ,就 不 再 袭 述 了 。 

最 后 主 函数 检查 字段 数组 长 度 是 否 等 于 字段 数 , 如 果 相 等 就 说 明 已 经 遍历 了 所 有 数组 ， 
此 时 程序 返回 获得 的 字段 数组 ,否则 释放 已 经 获取 的 字段 数组 。 

至 此 ,完成 了 对 dvmGetDeclaredFields 函数 的 详细 分 析 。 


4.6 ”模块 内 部 函数 调用 关系 


反射 机 制 模 块 内 部 函数 调用 关系 主要 集中 在 两 个 方面 : 反射 机 制 本 地 方法 接口 对 反 
射 机 制 实 际 执行 函数 的 调用 ; 四 反射 机 制 实际 执行 函数 内 部 对 各 个 功能 点 函数 的 调用 。 由 
于 反射 机 制 主要 面向 对 Java 层 API 的 实现 ,因此 根据 “三 层 结构 ”的 实现 框架 ,单个 接口 的 
调用 关系 相对 简单 ,但 由 于 核心 库 中 反射 API 较 多 并 且 各 个 接口 的 调用 关系 十 分 相似 , 因 
此 ,就 不 在 此 一 一 展示 ,下 面 主 要 根据 两 方面 的 调用 关系 , 举 出 具有 代表 性 的 实例 以 展示 反 
射 机 制 内 部 的 调用 机 制 的 具体 特征 。 


4.6.1 反射 机 制 本 地 方法 接口 对 反射 机 制 实 际 执行 函数 的 调用 


在 这 里 主要 通过 一 个 本 地 方法 的 调用 关系 示例 以 展示 本 地 方法 对 反射 机 制 执行 函数 的 
调用 关系 。 


Class 类 中 getConstructor 方法 (用 于 取得 指定 的 类 构造 函数 ) 的 本 地 方法 接口 Dalvik_ 


java_lang_Class_getDeclaredConstructorOrMethod 对 下 层 各 个 执行 函数 的 调用 关系 如 
图 4.24 所 示 。 


dvmCreateCstrFromString 


Dalvik_java_lang_Class_getDeclared 
ConstructorOrMethod 


findConstructorOrMethodInArray 


KC dvmGetDeclaredConstructorOrMethod createTargetDescriptor 


dvmReleaseTrackedAlloc 


4.24 Dalvik_java_lang_Class_getDeclaredConstructorOrMethod 函数 调用 


从 图 4. 24 中 可 以 看 到 ,本 地 方法 通过 调用 dvmGetDeclaredConstructorOrMethod 函数 
完成 取得 指定 构造 函数 或 方法 的 目标 。 

通过 以 上 例子 较 直 观 地 展示 了 反射 机 制 本 地 方法 接口 对 反射 机 制 实际 执行 函数 的 调用 
关系 。 


4.6.2 反射 机 制 实际 执行 函数 内 部 对 各 个 功能 点 函数 的 调用 


在 这 里 主要 通过 三 个 本 地 方法 的 调用 关系 示例 以 展示 本 地 方法 对 反射 机 制 执行 函数 的 
调用 关系 。 
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(1) createFieldObject 函数 (用 于 创建 一 个 字段 对 象 ) 对 下 层 各 个 执行 函数 的 调用 关系 
如 图 4.25 所 示 。 
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4.25 createFieldObject 函数 调用 


从 图 4. 25 中 可 以 看 到 ,createFieldObject 函数 通过 调用 一 系列 功能 点 函数 实现 了 其 目 
标 功 能 ,其 中 dvmAllocObject 函数 用 于 实现 关键 步骤 一 一 创建 一 个 字段 对 象 。 

(2) createConstructorObject 函数 (用 于 创建 一 个 构造 函数 实例 对 象 ) 对 下 层 各 个 执行 
函数 的 调用 关系 如 图 4. 26 所 示 。 
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4.26 createConstructorObject 函数 调用 


从 图 4. 26 中 可 以 看 到 ,createConstructorObject 函数 通过 调用 一 系列 功能 点 函数 实现 
了 其 目标 功能 ,其 中 dvmAllocObject 函数 用 于 实现 关键 步骤 创建 一 个 构造 函数 对 象 。 

(3) dvmCreateReflectMethodObject 函数 (用 于 创建 一 个 方法 类 型 实例 对 象 ) 对 下 层 各 
个 执行 函数 的 调用 关系 如 图 4. 27 所 示 。 

从 图 4. 27 中 可 以 看 到 ,dvmCreateReflectMethodObject 函数 通过 调用 一 系列 功能 点 函 
数 实现 了 其 目标 功能 ,其 中 ,dvmAllocObject 函数 用 于 实现 关键 步 又 一 一 创建 一 个 方法 实 
例 对 象 。 

通过 以 上 三 个 例子 较 直观 地 展示 了 反射 机 制 实 际 执行 函数 内 部 对 各 个 功能 点 函数 的 调 
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用 关系 。 
点 拨 ”以 上 便 是 对 模块 内 部 调用 关系 的 实例 分 析 , 总 的 来 说 ,反射 机 制 相 对 于 虚拟 机 中 
的 其 他 功能 模块 要 更 接近 上 层 应 用 ,实际 上 就 是 对 Java 类 库 中 反射 API 的 底层 实现 ,然而 


这 种 实现 是 以 “三 个 层次 ”结构 为 基础 的 。 
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convertSignaturePartToClassArray ConvertS lenaturePart ToClass 
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4.27 dvmCreateReflectMethodObject 函数 调用 


小 2 


本 章 对 反射 机 制 原 理 进行 了 详细 分 析 ,首先 分 析 API 结构 ,总 结 出 反射 机 制 API- 本 地 
方法 -底层 函数 的 接口 “三 层 结构 ?体系 ,具体 说 明 反 射 机制 在 Dalvik 虚拟 机 中 的 实现 流程 。 
随后 对 反射 机 制 中 所 涉及 的 核心 类 进行 详细 分 析 ,说 明 类 中 具体 方法 的 实现 流程 ,并 绘制 流 
程 图 。 最 后 对 核心 函数 进行 详细 分 析 , 逐 行 解读 函数 作用 、 功 能、 原理 和 流程 ,并 绘制 函数 流 
程 图 。 


Lk) 


第 S 但 
解释 器 模块 的 原理 及 实现 


本 章 主要 内 容 


?Dalvik 是 如 何 执行 字 节 码 的 ? 
外 如 何 克 服 不 同 硬件 平台 带 来 的 程序 移植 性 问题 ? 
如 尽 可 能 地 复 用 代码 和 模块 化 设计 的 目的 是 什么 ? 


解释 器 是 Dalvik 虚拟 机 的 执行 引擎 , 它 负责 解释 执行 Dalvik 字 节 码 。 在 字 节 码 加 载 完 
毕 后 ,Dalvik 虚拟 机 调用 解释 器 开始 取 指 解释 字 节 码 , 解 释 器 跳 转 到 解释 程序 处 执行 。 在 
Android 4. 04 版 本 中 ,解释 器 共有 两 种 , 称 作 移动 型 (Portable) 解 释 器 和 快速 型 (Fast) 解 释 
器 ,分 别 采用 C 语言 实现 和 汇编 语言 实现 。 


5.1 概述 


快速 型 (Fast) 解 释 器 是 由 Google 公司 为 提高 运行 效率 用 汇编 语言 重 写 的 解释 器 。 系 
统 使 用 Portable 解释 器 还 是 Fast 解释 器 是 由 Android 开机 时 就 已 经 决定 的 。 在 Fast 解释 
器 中 ,汇编 的 实现 是 针对 特定 平台 的 ,而 且 在 执行 完成 之 后 可 自动 取 指 并 跳 到 相应 的 地 址 开 
始 解释 ,所 以 有 比较 高 的 效率 ,也 是 作为 默认 的 解释 器 。 同 时 ,为 了 克服 可 移植 性 低 的 缺点 ， 
也 提供 了 Fast 解释 器 的 C 语言 实现 。 

Portable 解释 器 是 最 初 采 用 的 方案 ,虽然 效率 较 Fast 解释 器 低 , 但 是 有 移植 性 好 的 特 
点 。 在 Android 4.04 版 本 中 采用 GCC 的 Threaded 技术 优化 后 ,Portable 解释 器 的 效率 有 
了 质 的 提升 。 

在 设计 实现 上 ,Dalvik 虚拟 机 解释 器 采用 的 是 模块 化 的 设计 和 实现 ,有 高 内 聚 低 耦 合 
的 特点 。 所 以 可 移植 性 非常 好 ,对 于 不 同 的 平台 只 需要 修改 少量 的 代码 和 配置 文件 , 即 
可 快速 得 到 相应 平台 的 代码 。 同 时 ,在 Fast 解释 器 汇编 语言 中 ,也 有 部 分 代码 调用 C 语 
言 实 现 , 减 轻 实 现 的 难度 ;Fast 解释 器 C 实现 中 ,可 以 直接 调用 C 代码 ,以 提高 解释 器 的 
效 府 5 


5.2 解释 器 执行 原理 
获取 字 节 码 并 分 析 与 解释 执行 是 Dalvik 虚拟 机 解释 器 的 主要 工作 。Dalvik 虚拟 机 的 入 口 


函数 是 vm/interp 下 的 dvmInterpret 函数 。 外 部 通过 调用 dvmInterpret 函数 进入 解释 器 执行 ， 
Android 中 解释 器 与 线程 是 一 一 对 应 的 ,外 部 调用 解释 器 解释 指令 的 流程 图 如 图 5. 1 所 示 。 
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| dvmCallMethod |—~| dvmCallMethodV 上 一 | dvminterpret | 


图 5.1 外 部 调用 


在 外 部 函数 调用 解释 器 后 ,解释 器 执行 的 主要 流程 有 如 下 几 个 步骤 。 

(1) 初始 化 解释 器 执行 环境 ; 

(2) 根据 系统 参数 得 到 执行 Fast 解释 器 还 是 Portable 解释 器 ; 

(3) 跳 转 到 相应 的 解释 器 执行 ; 

(4) 取 指 及 指令 检查 ; 

(5) 执行 字 节 码 对 应 的 程序 段 。 

dvmInterpret 函数 作为 解释 器 的 和 人口 函数 ,主要 完成 了 整个 流程 的 前 三 部 分 ,执行 流程 
如 图 5. 2 所 示 。 


解释 的 


方法 类 末 初 始 化 
或 类 初始 化 错误 ? 
i 


否 


是 。| 设置 Fast 解 释 器 
使 用 Fast 解 释 器 ? et 


ME 
设置 Portable 解 释 器 继续 二 
执行 解释 执行 


5.2 解释 器 入 口 函数 流程 图 


(1) 解释 器 执行 环境 的 初始 化 。 主 要 是 对 解释 器 的 变量 进行 初始 化 。 解 释 器 得 到 将 要 
解释 的 方法 的 指针 method, 以 及 保存 当前 栈 指 针 self->interpSave. curFrame 和 程序 计数 器 
method-~insns。 

(2) 判断 将 要 解释 的 方法 是 否 合 法 。 主 要 进行 两 个 方面 的 判断 ,分 别 判 断 方法 是 否 是 本 
地 方法 dvmIsNativeMethod(method) 和 判断 方法 的 类 是 否 初始 化 CLASS_INITIALIZING 以 及 
初始 化 是 否 失败 CLASS_ERROR。 

(3) JIT 环境 的 设置 (如 果 有 JIT) 。 

(4) 选择 相应 的 解释 器 (比如 Fast 解释 器 或 Portable 解释 器 ) 来 执行 。 根 据 系 统 参数 
的 不 同 ,选择 不 同 的 解释 器 来 执行 解释 。 需 要 判断 执行 模式 gDvm. executionMode, 如 代码 
清单 5. 1 所 示 。 


dt 
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代码 清单 5.1 dalvik/vm/interp/Interp. cpp:dvmInterpret() 


证 gpDwmexecutiorMpde= =kExecutiorMpdeTnterpFast) 
stdInterp= dumMterpsta; 
#if defined (WITH JIT) 
else if (gpm.executionMpde== KExecutionModeJit) 
stdInterp= dM-erpStd; 
#endif 
else 
stdInterp= dmInterpretPortable; 
通过 检查 gDvm. executionMode 的 值 来 选择 执行 模式 。 这 个 值 是 在 Dalvik 虚拟 机 启 
动 时 ,通过 解析 命令 行 参 数 获 得 的 。 值 有 三 种 情况 : DkExecutionModeInterpFast, 代 表 使 
用 Fast 解释 器 来 执行 字 节 码 解析 ,此 时 会 调用 dvmMterpStd 函数 进入 Fast 解释 器 执行 ; 
@kExecutionModeJit, 代 表 使 用 JIT( 即 时 编译 ) 来 编译 执行 ,使 用 的 解释 器 是 Fast 解释 器 ; 
@ 当 系统 判断 执行 模式 非 以 上 两 种 时 , 则 会 调用 dvmInterpretPortable 函数 来 使 用 Portable 
解释 器 执行 字 节 码 解析 。 
虽然 执行 模式 有 三 种 ,但 实际 上 解释 器 的 解释 模式 只 有 两 种 ,分 别 是 Fast 和 Portable， 
JIT 机 制 只 能 配合 Fast 解释 模式 使 用 。 所 谓 Fast 解释 器 和 Portable 解释 器 ,顾名思义 ， 
Fast 解释 器 的 主要 特点 是 快速 ,而 Portable 解释 器 的 拿手 好 戏 则 是 可 移植 性 。 虽 然 , 宏 观 
上 ,这 两 种 解释 器 的 解释 方式 是 类 似 的 ,但 在 细节 上 ,其 执行 流程 和 实现 原理 有 一 些 不 同 。 
下 面 就 两 种 解释 器 分 别 做 分 析 。 


5.3 Portable 解释 器 实现 分 析 


Portable ,英文 解释 是 指 “ 便 携 式 的 ,轻便 的 ”, 顾 名 思 义 ,在 Dalvik 中 ,Portable 也 是 便 
携 式 的 ,其 实现 不 依赖 底层 硬件 平台 ,比如 针对 ARM 和 x86 ,都 可 以 使 用 。 究 其 原因 , 主要 
是 因为 其 使 用 纯 C 实现 的 。 其 主体 是 一 个 巨大 的 C 函数 。 在 任何 支持 gcc 的 系统 里 都 可 以 
编译 ,其 具体 实现 依赖 于 GCC 的 Threaded Code 技术 。 


5.3.1 字 节 码 解析 原理 


根据 解释 器 的 功能 ,可 以 想到 的 最 简单 的 模型 就 是 用 一 个 大 的 switch 语句 ,对 每 条 指 
令 进行 判断 ,然后 case 到 相应 的 代码 进行 解释 ,解释 完成 后 又 要 回 到 switch 顶部 ,如 代码 清 
单 5.2 所 示 。 
代码 清单 5. 2 解释 器 模型 
while (insn) { 
switch (insn) { 
Case NOP: 
break; 
Case MN: 
do samethingz break; 
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Case OP: 

do somethingz break; 
Gefault: 

do samething; 


取 指 ; 
} 


然而 当 解 释 完 成 一 条 指令 后 ,再 重新 判断 指令 类 型 是 个 昂贵 的 开销 。 因 为 对 于 每 条 指 
令 ,都 将 从 switch 顶部 开始 判断 ,也 就 是 从 NOP 指令 开始 判断 ,直到 找到 相应 的 指令 为 止 ， 
这 使 得 解释 器 的 执行 效率 十 分 低下 。 

Dalvik 对 此 的 解决 方案 是 采用 了 GCC 的 Threaded Code 技术 ,可 以 获得 极 高 的 分 发 效 
率 。 每 条 指令 都 有 一 个 对 应 的 标签 (label) ,标签 标示 的 是 该 指令 解释 程序 的 开始 。 在 每 条 
指令 的 解释 程序 末尾 ,有 取 指 动作 ,可 以 取得 下 一 条 要 执行 的 指令 ,根据 指令 的 不 同 , 使 用 
threaded 机 制 ,可 以 goto 到 相应 的 标签 处 执行 解释 程序 ,避免 了 重新 跳 转 到 switch 顶部 重 
新 case 这 个 昂贵 的 操作 。 

那 GCC 的 Threaded Code 技术 又 有 什么 特点 呢 ? 在 C 文件 中 ,可 以 使 用 "&& 芭 ?获得 函 
数 或 函数 内 部 标签 地 址 ,而 goto 语句 可 以 直接 跳 转 到 这 些 地 址 。 通 常情 况 下 是 设置 一 个 静 
态 数 组 ,用 来 存储 标签 地 址 。 例 如 : 


static void * array[]= {&&foo0, &gbar, &ghack}; 


从 而 可 以 根据 索引 选择 一 个 标签 并 跳 转 ,如 : 


goto * array[i]; 

可 以 看 到 标签 的 使 用 和 switch 有 点 类 似 , 但 是 switch 语句 能 更 清楚 地 表达 含义 ,所 以 
不 到 万 不 得 已 的 时 候 , 尽 量 不 要 使 用 这 个 技术 。 

读者 应 该 已 经 明白 ,解释 器 是 如 何 从 GCC 的 这 项 技术 中 获 益 的 了 。 不 错 ,Portable 解 
释 器 的 实现 使 用 了 标签 数组 ,由 此 达到 了 极 高 的 分 发 (dispatch) 效 率 。 

点 所 Threaded Code 技术 也 叫 Label as Value, 具 体 的 信息 可 以 查看 GCC 的 官方 帮 
助 文档 : http://gcc. gnu. org/onlinedocs/gcc-4. 1. 1/gcc/Labels-as-Values. html # Labels- 
as-Values。 

Dalvik Portable 维护 了 一 个 静态 数组 ,用 来 存储 各 个 字 节 码 解释 程序 对 应 的 标签 地 址 。 
其 具体 以 一 个 宏 来 定义 ,如 代码 清单 5. 3 所 示 。 

代码 清单 5.3 dalvik/libdex/DexOpcodes. h:DEFINE_GOTO_TABLE 


# define DEFTNE GOTO TABIF( name) 
Static const voidx _name[kKNumPackedopcodes]={ 
HP NOP), 
HP MWE), 
HOP MWE, FROML6)， 


五 i A i 


bs 
DEFINE_GOTO_TABLE 宏 在 使 用 时 ,将 定义 一 个 静态 数组 。 在 其 中 ,根据 C 语言 中 


Ha 
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宏 的 定义 ，name 将 被 具体 名 称 代 蔡 ;而 内 部 元 素 也 由 宏 控 制 。 在 Portable 版 解释 器 实现 
中 有 如 代码 清单 5.4 所 示 的 宏 定 义 。 
代码 清单 5.4 vm/mterp/out/InterpC-portable. cpp: H(_op) 


#define = H() gsop ## op 


该 宏 中 的 “# # ”在 C 语言 里 被 称 为 连接 符 , 用 来 连接 两 个 token。 在 预 处 理 的 时 候 ， 
Goto Table 中 的 元 素 将 会 被 做 相应 的 替换 。 以 HICOP_NOP) 为 例 , 预 处 理 后 将 会 被 蔡 换 为 
&&op OP_NOP。 根 据 前 面 叙 述 过 的 Threaded Code 技术 ,&&op_OP_NOP 是 取 标 签 
op_OP_NOP 的 地 址 。 由 此 可 以 看 到 ,静态 数组 中 存储 的 将 是 各 个 Label 的 地 址 。 

每 一 个 Label 都 对 应 于 一 段 相 应 的 指令 解释 程序 。 标 签 处 的 地 址 即 是 解释 程序 的 开始 

地 址 。 由 此 ,可 以 为 Goto Table 中 的 元 素 和 前 述 的 指令 解释 程序 的 实现 建立 一 一 对 应 的 关 
系 ,Goto Table 中 每 一 项 元 素 对 应 了 相应 解释 程序 的 开始 地 址 。 
在 解释 器 开始 执行 时 ,通过 DEFINE_GOTO_TABLE(handlerTable) 宏 的 执行 建立 了 
如 图 5. 3 所 示 的 一 张 名 为 HandlerTable 的 表 。 我 们 将 这 一 过 程 称 为 GOTO Label 的 绑 定 。 
在 图 中 ,可 以 看 到 HandlerTable 中 每 一 个 元 素 都 指向 了 一 个 Label。 每 个 Label 都 对 应 了 
一 段 解释 程序 。 


HandlerTable Label 


HANDLE_OPCODE(OP_NOP) 


0x00 OP_NOP | 一 一 FINISHO); 
OP_END 
0x01 OP_MOVE HANDLE_OPCODE(OP_MOVE /*vA, vB*/) 


vdst = INST_Al(inst); 
vsrcl =INST_B(inst); 
ILOGV("Imove%s v%d,v%od 
0x02 OP MOVE_FROM16 %s(v%d=0x%608x)"， 
(INST_INST(inst) 一 OP MOVE)? "" : 
"-object", vdst, vsrcl， 
kSpacing, vdst, 
GET_REGISTER(vsrcl)); 
SET_REGISTER(vdst, 
GET_REGISTER(vsre1)); 
FINISH(1); 
OP_END 


0x67 OP_SPUT 

HANDLE_SPUT_X(OP_SPUT_WIDE, 
Ox68 OP SPUT WIDE | "-wide", Long, WIDE) 

OP END 


5.3 ”Portable 解释 器 指令 解释 程序 构造 图 
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同时 ,如 何 根据 指令 得 到 对 应 的 Label 地 址 呢 ? 在 Dalvik 中 ,利用 Opcode-gen 工具 生 
成 了 每 个 字 节 码 在 HandlerTable 中 的 索引 号 ,如 代码 清单 5. 5 所 示 。 如 图 5. 3 中 左 侧 的 十 
六 进 制 数 字 。 比 如 对 于 NOP 操作 ,对 应 的 索引 号 为 0x00; MOVE 操作 对 应 的 索引 号 是 
0x01。Dalvik 在 解析 字 节 码 时 ,根据 操作 码 的 类 型 ,可 以 得 到 指令 的 索引 号 ,由 索引 号 索引 
HandlerTable, 因 而 实现 了 Switch 中 的 case 操作 。 

代码 清单 5.5 dalvik/libdex/DexOpcodes. h:Opcode 


enum Opcode { 
OP NOP = 0x00, 
OP ME =0x01 
OP MIVE FRCMI6 =0x02 
OP MNWE 16 = 0x03 
OP MWE TIE = 0x04, 
OP _SPUT CBJECT VOLIATIE JUMBO =0xlfe, 
OP_THROW VERIFICATION FRROR JMBO =0x1ff, 


}; 


5.3.2 字 节 码 指 令 解 释 流 程 


在 明白 实现 解释 器 的 基本 模型 后 ,下 面 来 看 下 Dalvik Portable 的 执行 流程 。Portable 
解释 器 的 具体 执行 流程 如 图 5.4 所 示 。 


南明 恋 量 | 直 |__| 拷贝 当前 状态 至 | .| FINISH(0) 
声明 变量 | 一 | Goto 标 答 勿 定 -| 开始 声明 变量 | “| 开始 解释 指令 


| 


执行 


5.4 ”Portable 解释 器 解析 流程 图 


如 流程 图 中 所 示 ,在 解释 器 开始 解释 前 ,需要 设置 一 些 环境 ,包括 声明 变量 .Goto Label 
绑 定 以 及 拷贝 当前 的 状态 。 

首先 进行 相关 变量 的 声明 : 保存 当前 正在 解释 的 方法 curMethod 程序 计数 器 pc、 栈 帧 
指针 fp、 当 前 指令 inst、 指 令 译 码 的 相关 部 分 包括 保存 寄存 器 值 vsrc1l，vsrc2，vdst 设置 方 
法 调用 methodToCall 等 。 

通过 DEFINE_GOTO_TABLE(handlerTable) 这 一 宏 定 义 进行 GOTO Label 的 绑 定 ， 
获取 并 拷贝 self->interpSave 里 保存 的 当前 状态 ,包括 方法 method .程序 计数 器 pc 堆栈 帧 
curFrame、 返 回 值 retval、 要 分 析 的 Dex 文件 的 类 对 象 信息 curMethod clazz 一 pDvmDex 
等 到 已 声明 的 变量 ,如 代码 清单 5.6 所 示 。 
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代码 清单 5.6 dalvik/vm/mterp/out/InterpC-portable. cpp:dvmInterpretPortable() 


CMethod self- > interpSave.method; 

Pc= self- > interpSave.pc; 

fp self _ > interpSave.arFrame; 

retval= self— > interpSave.retval; 

methodclassDex= curMethod_ > clazz- > pDmDex; 

最 后 通过 调用 FINISH(0) 来 取得 第 一 条 指令 开始 执行 字 节 码 解 析 。 其 中 ,除去 状态 的 
备份 以 及 一 些 例 行 检查 判断 外 ,最 重要 的 两 项 是 Goto 标签 绑 定 和 FINISH 宏 的 执行 。 调 
用 FINISH 宏 开 始 取 指 跳 转 到 解释 程序 执行 ,在 解释 程序 的 最 后 进行 取 指 , 跳 转 执行 ,直到 
执行 到 最 后 一 条 指令 。 

在 设置 好 环境 后 ,开始 进行 正常 的 解释 程序 。 正 如 图 5. 3 中 所 示 , 在 Portable 解释 器 
中 ,每 一 条 指令 对 应 的 解释 程序 都 对 应 了 一 个 标签 ,每 一 个 标签 指明 了 对 应 的 解释 程序 段 。 
在 Dalvik Portable 中 ,解释 程序 是 由 一 系列 宏 定义 控制 ,以 对 应 的 Label 来 表示 ,以 NOP 操 
作为 例 , 该 操作 的 定义 如 代码 清单 5.7 所 示 。 

代码 清单 5.7 dalvik/vm/mterp/out/InterpC-portable. cpp: HANDLE _ OPCODE 
(OP_NOP) 

HANDILE, OFOODE (OP NOP) 

FINISH(D); 

OP FND 

HANDLE_OPCODE(OP_NOP) 表 示 对 应 的 是 OP_NOP 操作 , 紧 接 其 后 的 是 解释 程序 
的 具体 实现 。 到 OP_END 结束 。 而 在 Portable 中 ,所 有 的 解释 程序 都 由 C 语言 编写 。 
NOP 操作 中 的 HANDLE_OPCODE FINISH 和 OP_END 都 是 宏 定 义 。 

其 中 ,HANDLE_OPCODE 宏 定义 如 代码 清单 5. 8 所 示 。 

代码 清单 $.8 dalvik/vm/ mterp/out/InterpC-portable. cpp: HANDLE_OPCODE(_op) 


#define HANDIE OPOOLE ( cp) cp ##_op: 


注意 其 中 的 “:”, 经 过 宏 蔡 换 后 ,指明 了 这 是 一 个 Label。 因 此 ,对 于 NOP 指令 ， 
HANDLE_OPCODE(OP_NOP) 将 被 替换 为 

cp OP NDP: 

每 一 个 HANDLE_OPCODE 都 需要 和 OP_END 成 对 出 现 。 在 此 处 ,OP_END 的 宏 定 
义 如 下 所 示 : 

#define OP FND 

注意 其 定义 ,没有 错 ,OP_END 的 具体 定义 什么 都 没有 ! 也 就 是 说 ,经 过 预 处 理 后 ,OP_ 
END 将 消失 。 

因此 ,到 目前 为 止 ,经 过 预 处 理 后 ,NOP 指令 的 解释 程序 将 如 下 所 示 。 以 op_OP_NOP 
标签 指明 解释 程序 地 址 。 


op OP NDP: 
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FINISH (1); 


对 于 NOP 指令 ,其 完成 的 工作 就 是 什么 都 不 做 。 因 此 ,对 应 的 解释 程序 就 是 直接 取 下 
一 条 将 要 解释 的 指令 ,也 就 是 FINISH(1) 所 完成 的 工作 。 在 FINISHO 〇 宏 里 ,虚拟 机 获取 下 
一 条 指令 ,并 从 指令 中 提取 操作 码 号 ,根据 该 操作 码 号 到 指令 解释 程序 查找 表 中 得 到 相应 的 
标签 ,然后 跳 转 到 该 处 理 程序 执行 。 其 定义 如 代码 清单 5. 9 所 示 。 

代码 清单 5.9 dalvik/vm/mterp/out/InterpC-portable. cpp:FINISH(_offset) 


#define FINISH( offset) { 
ADJUST FC( offset); 
inst= FETCH(0); 
if (self- > interpBreak.ctl1.sutMbde){ 
dmCheckBefore (pc, fp, self); 
} 
goto * handlerTable[INST INST (inst)]; 


i 


} 


其 主要 流程 有 如 下 几 步 。 

(1) FINISH 宏 的 参数 是 偏 移 地 址 ,使 用 宏 ADJUST_PC(_offset) 来 调整 PC。 
ADJUST_PC 宏 首 先 会 判断 偏 移 地 址 是 否 溢出 ,若是 会 记录 错误 停止 虚拟 机 ,否则 会 根据 偏 
移 地 址 来 调整 PC 值 。 

(2) 接着 由 FETCH 指令 取 指 : 

代码 清单 5.10 dalvik/vm/mterp/out/InterpC-portable. cpp:FETCH(_offset) 


# define FETCH( offset) (pc[ (offset)]) 


(3) 判断 是 否 正 常 解释 指令 模式 : self 一 interpBreak. ctl. subMode, 若 不 是 则 调用 
dvmCheckBefore(pc, fp，self) 进 行 指令 检查 。 一 般 情 况 下 在 调试 或 性 能 测试 时 ,需要 进行 
指令 检查 。 

(4) 根据 操作 码 使 用 INST_INST 获取 指令 的 索引 号 。 

代码 清单 $. 11 dalvik/vm/mterp/out/InterpC-portable. cpp:INST_INST( _inst) 


# define INST INST(_inst) (Linst) & Oxff) 


(5) 最 后 使 用 goto * handlerTable[ INST_INST(inst)] 跳 转 到 指令 标签 处 开始 
执行 。 
以 图 5. 3 中 指令 的 执行 顺序 为 例 , 解 释 器 从 解释 NOP 指令 开始 ,由 于 NOP 指令 不 做 
任何 事 , 于 是 马上 开始 取 下 一 条 指令 。 取 得 的 指令 为 MOVE 指令 ,处 理 后 得 到 MOVE 的 
索引 号 为 1, 于 是 就 得 到 Goto Table 的 下 标 为 1 的 元 素 内 容 , 该 元 素 存储 的 是 MOVE 指令 
标签 的 地 址 。 最 后 用 goto 语句 跳 转 到 该 地 址 开始 MOVE 指令 的 解释 。 


5.3.3 一 个 解释 程序 的 例子 


在 Dalvik 中 ,有 二 百 多 条 指令 ,每 一 条 指令 都 有 对 应 的 解释 程序 。 本 节 以 整 型 的 算术 
运算 来 分 析 Portable 解释 器 中 的 指令 解析 程序 是 如 何 实 现 的 。 
在 Dex 文件 中 两 个 int 型 变量 进行 乘法 运算 的 指令 如 下 所 示 。 其 中 ,vl 和 v2 表示 的 是 
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寄存 器 。 其 对 应 的 操作 符 和 枚 举 值 为 OP_MUL_INT。 

ml int/2addr v1,v2 

通过 字 节 码 解析 的 原理 知道 ,这 一 指令 所 对 应 的 指令 解析 程序 是 经 过 宏 蔡 换 后 op_ 
OP_ MUL_INT 标签 对 应 的 程序 。 在 InterpC-portable. Cpp 中 可 以 找到 其 对 应 的 解释 程 
序 为 : 


HANDIE OP X INT (OP MIL INT, "ml", * ,0) 
OP END 


其 中 ,HANDLE_OP_X_INT 仍 是 一 个 宏 定义 : 


# define HANDIE OP X INT( poode, opname, cop, hkdiv) * 
HANDIE, OPOOPE ( coPcode /* vAA, VEB, vOC* /){**} 

替换 后 指定 了 其 中 _opcode 为 OP_MUL_INT, 也 即 HANDLE_OPCODE(_opcode) 对 
应 的 是 op_ OP_MUL_INT。 操作 码 名 称 _opname 为 “mul”, 操 作 _op 的 值 为 “* ”, 除 法 标志 
位 _chkdiv 为 0。 对 于 整 型 加 法 add-int、 整 型 减法 sub-int、 整 型 除法 div-int 的 解释 程序 均 有 
以 下 和 定义， 

HANDIE OP X INT(OP RDD INT,"add",+ ,0) 

HRNDIE OP X INT(OP SUB_INT, "sub",— ,0) 

HRNDIE OP X INT(OP DIV_INT, "div",/,1) 

可 以 看 到 ,4 种 运算 使 用 同一 个 宏 定义 ,通过 传递 不 同 的 参数 来 进行 不 同 的 运算 。 接 下 
来 就 详细 分 析 HANDLE_OPCODE(_opcode ) 的 具体 实现 。 

(1) 使 用 INST_AA(inst) 获 取 目 的 寄存 器 号 。 


vdst= INST AA(inst) 
(2) FETCH 进行 取 指 ,获取 两 个 操作 数 vsrcl 和 vsrc2。 


Vsrcl= srcRegs & Oxff; 

Vsrc2- srcRegs>> 8; 

(3) 判断 除法 标志 位 _chkdiv, 若 值 为 0, 表 示 为 加 \ 减 或 乘法 运算 , 则 取得 两 个 操作 数 的 
值 进行 对 应 的 运算 ,并 将 结果 存 和 人 寄存 器 vdst 中 : 


SET REGISTER (vdst, % 
(54) GET REGISTFR (vsrcl) op (54) GET REGTISTFR (vsrc2))7 


(4) 若 _chkdiv 值 为 1, 进行 除法 运算 ,首先 获得 两 个 操作 数 的 值 firstVal 和 
secondVal, 判 断 除数 secondVal 的 值 是 否 为 0, 若是 , 则 记录 当前 PC 值 并 抛 出 “ 除 以 零 ” 的 
算术 运算 异常 ,并 跳 转 到 异常 处 理 部 分 。 若 不 是 , 则 接 下 来 判断 firstVal 为 0 或 者 
secondVal 为 一 1 的 情况 ,分 别处 理 并 将 结果 存 人 result, 若 不 符合 上 一 个 情况 则 直接 使 用 
result 一 firstVal _op secondVal 式 子 完成 运算 ,最 后 使 用 SET_REGISTER(vdst， result) 将 
结果 存 人 寄存 器 。 
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(5) 运算 完成 使 用 FINISH(2) 宏 取得 下 一 条 指令 并 执行 。 
其 完整 代码 如 代码 清单 5. 12 所 示 。 
代码 清单 $. 12 dalvik/vm/mterp/out/InterpC-portable. cpp:HANDLE_OP_X_INT 


# define HANDIE OP X INT( cpcode，cpname，cp，chkdiv) 
HRNDIE OPOODE ( opcode /* VAA,VEB,VOC* /) 
{ 
1U2 srcRegs; 
vdst= INST AA(inst); 
srcRegs= FEICH (1); 
Vsrcl= srcRegs & Oxff; 
Vsrc2= srcRegs > > 8; 
IIOW ("|%s- int ved,ved", ( opname) ,vdst,vsrcl); 
证 ( chkdiv (=0) { 
54 firstVal, secondVal, result; 
firstVal= GET REGISTER (Vsrcl); 
secondVal= GET REGISTER (vsrc2) ; 
if (secondVal==0) { 
EXPORT FC(); 
drhrowArithmeticExoeption ("divige by zero"); 
OIO exceptionThromn (); 
} 
if ((u4)firstVal== 0x80000000 && secondVal==-1) { 
证 ( hdiv==1) 
result= firstVal; /* division */ 
else 
result= 0; /* reminder */ 
} else { 
result= firstVal _ap secondVal; 
} 
SET REGISTER (vdst, result); 
} else { 
/* Donr div/rem case * / 
SET REGTSTFR (vdst, 
(54) GET FEGISIER(VSIC1) _aqp (s4) GET REGISTFR (vsrc2))7 


a a a i 


} 

FINISH (2) 
流程 图 如 图 5.5 所 示 。 
Porable 解释 器 中 一 部 分 指令 解释 程序 采取 的 是 一 个 指令 对 应 一 段 不 同 的 解释 程序 ,而 

另 一 部 分 如 算术 运算 .让 语句 等 的 解释 程序 均 采取 上 述 这 种 形式 : 将 同一 类 型 的 解释 程序 
使 用 一 个 宏 定义 实现 ,通过 传递 不 同 的 参数 来 进行 不 同 运算 。 
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是 | 获取 两 个 操作 
数 的 什 


取得 两 个 操作 
数 的 值 并 计算 


是 _| 记录 PC 值 抛 出 
除数 secondVal 为 07 算术 运算 异常 


1 
跳 转 到 异常 
处 理 


1 
结果 存 入 寄存 器 将 结果 保存 到 
vdst 变量 Result 


5.5 算术 运算 指令 解释 程序 流程 


5.4 Fast 解释 器 C 实现 分 析 


Fast, 顾 名 思 义 ,有 更 快 的 解释 速度 。Fast 解释 器 是 汇编 实现 版 本 , 那 为 何 还 要 提供 
C 实现 版 本 呢 ? 当 前 硬件 平台 众多 , 且 发 展 十 分 迅速 ,为 这 些 硬件 平台 及 时 提供 一 个 针对 硬 
件 设 计 并 由 汇编 实现 的 解释 器 也 就 比较 困难 。 因 此 ,提供 了 C 实现 版 本 ,可 以 根据 硬件 平 
台 状 况 , 可 以 粹 合用 汇编 实现 的 和 由 C 实现 的 解释 程序 。 因 此 , 接 下 来 从 字 节 码 解 析 原 理 
和 字 节 码 指 令 解 释 流 程 两 个 方面 来 讲述 C 实现 的 Fast 解释 器 。 


5.4.1 字 节 码 解析 原理 


同样 作为 C 实现 的 解释 器 ,Fast 解释 器 和 Portable 解释 器 有 许多 的 代码 复 用 。 而 这 一 
切 都 是 通过 一 系列 的 宏 实 现 的 。 与 Portable 类 似 , 在 该 版 本 的 解释 器 中 也 使 用 5. 3. 1 节 中 
所 述 的 静态 数组 ,所 不 同 的 是 数组 中 的 元 素 是 解释 程序 对 应 的 函数 指针 。 同 样 地 也 是 利用 
DEFINE_GOTO_TABLE 这 个 宏 ,所 不 同 的 是 静态 数组 元 素 的 宏 H 将 被 奉 换 为 dvmMterp_# 
##_op, 如 代码 清单 5. 13 所 示 。 

代码 清单 5.13 dalvik/vm/mterp/out/InterpC-allstubs. cpp 

#ungef H 


#define H( op) dnMterp #8#_op 
TEFTNE GOTO_TABIF (gnMterpHandlers) 
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#undef H 

#define H( op) #_op 

TDEFTNE GOTO TABIE (gpwrMterpHandlerNames) 

结合 Portable 版 本 解释 器 实现 ,可 以 看 到 ,这 里 定义 了 两 个 静态 数组 ,数组 中 的 元 素 是 
函数 指针 ,函数 名 以 dvmMterp_ 开 头 。gDvmMterpHandlers 数组 对 应 的 是 各 个 操作 码 解释 
程序 的 入 口 地 址 ;gDvmMterpHandlerNames 对 应 的 是 各 个 操作 码 的 名 称 , 在 输出 日 志 时 可 
以 用 到 。 于 是 ,定义 的 两 张 表格 如 图 5.6 和 图 5.7 所 示 。 


0x00 dvmMterp OP NOP 0x00 OP NOP 
0x01 | dvmMterp OP MOVE Ox01 OP MOVE 
0x59 | dvmMterp OP IPUT 0x59 OP IPUT 
0x5a | dvmMterp OP IPUT_ WIDE Ox5a OP IPUT WIDE 
图 5.6 操作 码 解 释 程序 函数 指针 图 5.7 操作 码 解释 程序 名 称 
在 C 实现 的 Fast 解释 器 中 ,各 个 指令 对 应 的 程序 不 再 以 标签 指明 ,而 是 以 函数 的 形 
式 存在 。 因 此 在 建立 的 gDvmMterpHandlers 中 存储 的 就 是 这 些 函 数 的 地 址 ,如 图 5.8 


所 示 。 


HANDLE_OPCODE(OP_ NOP) 
~ FINISHO); 
OP_END 


Ox00 &OP_NOP 


0x01|__ &OP_MOVE 人 HANDLE_OPCODE(OP_MOVE /*vA, vB*/) 


vdst = INST_Al(inst); 
vsrel = INST_B(inst); 
052| &OP IPUT | I) SET REGISTER(vdst, 
Ox5a| &OP IPUT_WIDE GET_REGISTER(vsrcl)); 
FINISH(1); 
OP_END 


HANDLE_IPUT_X_JUMBO(OP_IPUT_WID 


Sol E_JUMBO, "-wide", Long, WIDE) 


OP_END 


图 5.8 函数 指针 表 


读者 应 该 已 经 发 现 , 其 索引 方式 是 和 Portable 一 样 的 ,都 是 以 操作 码 类 型 对 应 的 枚 举 
值 为 数组 下 标 ,取得 解释 函数 的 函数 指针 ,再 进行 解释 。 


5.4.2 字 节 码 指 令 解释 流程 


Fast 解释 器 通过 一 个 while 循环 来 实现 取 指 、 指 令 检查 、 跳 转 到 相应 函数 来 解释 指令 、 
指令 解释 完成 后 回 到 主 函 数 。 在 每 个 while 循环 开始 ,解释 器 取得 将 要 解释 的 指令 并 进行 
指令 检查 ,然后 根据 指令 ,得 到 函数 指针 表 中 的 索引 号 ,根据 索引 号 得 到 函数 地 址 并 跳 转 执 
行 函数 ,指令 解释 完成 后 又 回 到 主 函 数 ,开始 下 一 个 指令 的 解释 。 既 不 同 于 普通 的 switch 
方式 ,也 不 同 于 Gec 的 Thread Coded 技术 。 


127 


128 


Android Dalvik 虚拟 机 结构 及 机 制 剖 析 一 一 第 2 卷 Dalvik 虚拟 机 各 模块 机 制 分 析 


Fast 解释 器 人 口 函 数 是 dvmMterpStd, 在 这 个 函数 中 执行 解释 器 环境 的 配置 ,通过 调 
用 dvmMterpStdRun 函数 来 完成 字 节 码 解 析 。 在 Fast 解释 器 的 两 种 实现 中 分 别 使 用 C 语 
言 和 汇编 语言 实现 了 dvmMterpStdRun 函数 。 代 码 清单 中 所 示 的 while 循环 在 dalvik/vm/ 
mterp/out/InterpC-allstubs. cpp 文件 中 的 dvmMterpStdRun 函数 中 。while 循环 的 判断 条 
件 一 直 为 真 , 当 指令 是 长 跳 转 时 , 才 跳 出 这 个 循环 。 其 执行 流程 图 如 图 5.9 所 示 。 


(各 指 人 开始 ) 
1 
取 括 4 上 一 | 哄 到 外 铺 处 |] 输出 日 志 


| 


检查 指令 是 否 | __| 查找 指令 解释 句柄 
合格 表 , 得 到 指令 句柄 


是 


5.9 dvmMterpStdRun 函数 执行 流程 图 


在 while 循环 的 主体 部 分 ,主要 有 以 下 几 点 和 Portable 不 同 : 取 指 ; @FINISH 宏 ， 
加 解释 程序 的 构造 。 

在 伪 代 码 中 可 以 看 到 , 取 指 在 while 开始 后 所 要 做 的 第 一 步 ,已 经 和 FINISH 宏 制 离 
开 。 和 Portable 在 指令 结束 后 直接 取 指 跳 转 不 同 ,需要 先 返 回 主 函 数 。 其 具体 如 下 所 示 ， 
只 要 获得 pc 数组 中 的 第 一 条 指令 即 可 。 

U2 inst= /* self- > interpSave. * /pc[0]; 

在 FINISH 宏 中 取消 了 取 指 操作 后 ,FINISH 宏 也 只 需要 进行 pc 值 的 调整 ,不 再 需要 
做 取 指 的 动作 。 

最 后 ,和 Portable 不 同 的 是 解释 程序 形式 上 都 是 函数 。 在 Fast 版 的 C 语言 实现 中 ,了 
数 的 定义 用 的 都 是 c 文件 夹 下 的 代码 片段 ,所 以 和 Portable 版 的 解释 程序 在 形式 上 是 一 样 
的 ,只 是 用 不 同 的 宏 来 替换 后 ,在 Fast 版 中 就 成 为 函数 ,而 在 Portable 版 则 为 标签 。 操 作 码 
解释 程序 中 每 一 个 操作 码 都 对 应 一 个 函数 ,函数 的 参数 是 self 指针 ,并 且 返 回 空 。 在 文件 中 
同时 定义 了 两 个 操作 码 解释 程序 代码 片段 的 宏 , 如 代码 清单 5. 14 所 示 。 

代码 清单 $. 14 dalvik/vm/mterp/out/InterpC-allstubs. cpp: HANDLE_OPCODE( _op) 


# define HANDIE OFOOPE ( op) 
extem "C" void dnMterp ## op(Thread* self); 
void dMterp ##_ cop(Thread* self) { 
ud ref; 
U2 vsrcl,vsrc?,vdst; 
WW inst= FETCH(0); 
(void) ref; (void)vsrcl; (void)vsrc2; (void)vdst; (void)inst; 
# define OP FND } 


以 NOP 操作 为 例 ,其 实现 代码 如 代码 清单 5. 15 所 示 。 可 以 看 到 NOP 的 具体 操作 和 


本 本 可 症 丁丁 
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Portable 实现 没有 本 质 的 差别 。 
代码 清单 5.15 dalvik/vm/mterp/out/InterpC-allstubs. cpp 
HANDIE, OPOOLE (OP NOP) 
mmsHd); 

OP END 

在 对 上 述 两 个 不 同 定义 的 宏 预 处 理 后 ,就 定义 了 一 个 函数 。 最 终 实现 的 代码 如 代码 清 
单 5.16 所 示 。 

代码 清单 5.16 dalvik/vm/mterp/out/InterpC-allstubs. cpp 

extem "Cn void dmMterp OP NOP (Thread* self); 

void dmMterp OP NOP (Thread* self) { 

ud4 ref; 
UW vsrcl,vsrc?,vdst; 
U2 inst= FETCH (0); 

(voig) ref; (void)vsrcl; (void)vsrc2; (void)vdst; (void)inst; 

FINISH(1); 

} 

所 有 的 操作 码 都 像 NOP 操作 那样 定义 ,经 过 预 处 理 后 得 到 了 操作 指令 函数 的 定义 。 
函数 指针 表 中 的 元 素 是 对 应 的 解释 程序 的 函数 指针 。 每 段 指令 解释 程序 则 是 对 应 函数 的 具 
体 实 现 , 这 样 建立 起 函数 指针 表 和 解释 程序 一 一 对 应 的 关系 。 通 过 查找 函数 指针 表 ,得 到 函 
数 指针 , 即 可 跳 转 到 解释 程序 函数 的 实现 位 置 执行 。 

点 拨 ”阅读 Dalvik 解释 器 的 代码 ,由 圳 感到 宏 的 强大 ,以 及 因此 带 来 的 代码 复 用 的 魅 
力 。C 实现 的 Fast 解释 器 相 比 于 Portable 解释 器 ,更 改 的 代码 非常 少 。 


5.5 Fast 解释 器 汇编 实现 分 析 


汇编 实现 的 解释 器 是 针对 平台 优化 的 。 在 vm/interp/out 目录 下 可 以 看 到 依据 不 同 平 
全 而 命名 的 InterpC-< 一 arch 二 . c,， InterpAsm- 一 arch 二 . S 代码 ,可 以 针对 不 同 的 平台 采取 不 
同 的 指令 集 。 在 Dalvik 中 ,主要 有 ARM 和 x86 两 种 平台 的 实现 。 下 面 来 看 下 针对 两 个 平 
台 的 实现 有 何不 同 。 其 中 ,ARM 平台 主要 分 析 InterpAsm-Armv7-a-neon. S,x86 平台 主要 
分 析 InterpAsm-x86. S。 


5.5.1 字 节 码 解析 原理 


和 Portable 的 Threaded Code 机 制 类 似 , Fast 解释 器 采用 了 computed-goto 和 jump- 
table 的 机 制 实现 自动 取 指 。ARM 采用 前 者 ,x86 采用 后 者 。 

所 谓 的 computed-goto 机 制 , 实 现 上 ,各 个 指令 的 解释 程序 严格 限制 在 固定 大 小 。 
ARM 平台 默认 为 64B。 在 内 存 中 ,按照 字 节 码 号 的 顺序 从 名 为 dvmAsmInstructionStart 
的 地 址 处 开始 ,依次 紧 挨 着 排列 。 如 果 某 条 指令 解释 程序 大 小 小 于 64B, 剩 余 空间 就 空 着 ; 
如 果 大 于 64B, 则 这 条 指令 应 该 放 在 附加 空间 里 ,每 条 指令 处 理 程序 以 适当 的 方式 在 主 处 理 
程序 空间 和 附加 空间 之 间 建 立 跳 转 关系 。 如 代码 清单 5. 17 所 示 , 以 L_OP_NOP 开始 , 依 
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次 以 . balign 64 对 齐 64B。 在 获取 指令 类 型 枚 举 值 后 ,根据 公式 dvmAsmInstructionStart 十 
OP X64 即 可 跳 转 到 下 一 条 指令 。 
代码 清单 5.17 dalvik/vm/mterp/out/InterpAsm-armv7-a-neon.S 


dAsmInstructionStart= .L OP NOP 
.text 
.balign 64 
LOP NOP: /* Ox00 */ 
FETCH AIWANCE, INST (1) @ advance to next instr, l0ad rINST 
GET INST OFOOTE (ip) @ jp<- apcode from rINST 
GOTO OFOOTE (ip) Q@execute it 
.balign 64 
LOP MWE: /* Ox01 * / 
/* for movempve- cbject,long-to-int * / 


/x pVvAVB*/ 

mv rl,rINST, lsr #12 @rl<-B fran 15:12 

Ubfx  r0,rINST,# 8,#4 Qr0<-R fram 11:8 

FETCH MANCE INST() @ advance rFC, l0ad rINST 
GET VREG(r2,r1) @ r2< - fp[B] 

GET JINST OPOOLE (ip) @ ip< - apcode from rINST 
SET VREG(r2, r0) @ fpA<-r2 

GOTO OPOOLE (ip) Q execute next instruction 
-balign 64 


-了 OP MWE FROMI6: /* Ox02 */ 


以 图 形 展示 ,具体 的 指令 安排 如 图 5. 10 所 示 。 


HandlerTable Label 
0x00 OP_ NOP 
| HANDLE_OPCODE(OP_NOP) 
0x01 OP_MOVE ~ FINISHO): 
0x02 | OP_MOVE FROMI16 OP_END 
HANDLE_OPCODE(OP_ MOVE /*vA, vB*/) 
0x67 OP_ SPUT vdst = INST_Alinst); 
| vsrcl = INST_B(inst); 
Ox68 | _OP SPUT_WIDE | ILOGV("Imove%s vod,v od 
nas Yos(v%od=0x%08x)", 
(NST_INST(insb == OP_MOVE)? ™: 


"-object", vdst, vsrcl， 
kSpacing, vdst, 
GET_REGISTER(vsrcl)); 
SET_REGISTER(vdst, 
GET_REGISTER(vsrcl)); 
FINISH(1); 
OP_END 


HANDLE_SPUT_X(OP_SPUT_WIDE, 
"-wide", Long, _WIDE) | 
OP_END 


图 5.10 Fast 解释 器 汇编 实现 指令 安排 表 
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另 一 方面 ,所 谓 jump-table 机 制 ,是 指 和 Portable 解释 器 类 似 , 也 通过 一 个 数组 来 确定 
接 下 来 跳 转 的 地 址 。 在 x86 平台 的 配置 文件 中 可 以 看 到 , x86 正 是 采用 的 这 种 方式 。 与 
ARM 不 同 , 所 有 的 指令 解释 程序 存储 在 连续 的 地 址 中 ,每 个 指令 解释 程序 所 占 的 内 存 大 小 
是 任意 的 。 在 以 dvmAsmlInstructionStart 地 址 开始 处 存储 了 指令 解释 程序 的 地 址 ,可 根据 
操作 码 跳 转 到 相应 的 解释 程序 。 如 代码 清单 所 示 ,其 定义 和 ARM 类 似 , 只 是 少 了 64B 的 对 
齐 。 但 是 定义 了 如 代码 清单 5. 18 所 示 的 jump-table, 其 中 存储 的 是 各 个 指令 的 标签 ,和 
Portable 解释 器 中 的 静态 数组 使 用 方式 类 似 , 根 据 首 地 址 dvmAsmInstructionStart 和 指令 
类 型 枚 举 值 得 到 其 跳 转 的 Label。 

代码 清单 $. 18 dalvik/vm/mterp/out/InterpAsm-x86.S 

dmAsmInstructionstartCode= .L OP NOP 

-text 本 


:LOP NOP: /* Ox00 */ 

/* File: x86/0P NOP.S * / 
FETCH INST OPOODE 1 $ecx 
RIVRNCE FC1 
GOTO NEXT R secx 


:LOP MWE: /* Ox01l * / 

/* File: x86/0P MWE.S * / 
/* formove,mve- cbject,long-to-int */ 
/x* pVvAVB*/ 


-D OP MWE FROML6: /* Ox02 */ 
/* File: x86/0P MWE FROMI6.S * / 


.glabal dwmAsmInstructionstart 
-text 
GAsmInstructionstart: 
-long .L OP NOP /x* Ox00 */ 
.long .L OP MWE /* Ox0l */ 
.long .L OP MOVE FROML6 /< OQx02 * / 


指令 解释 程序 的 内 存 构造 以 及 跳 转 执行 方式 如 图 5. 11 所 示 。 
5.5.2 字 节 码 解 析 流 程 


在 当前 版 本 由 汇编 实现 的 解释 器 中 ,运作 原理 和 Portable 解释 器 类 似 。 在 解释 程序 结 
束 后 ,直接 取 指 ,查找 表 并 跳 转 。 解 释 器 主线 程 通过 调用 dvmMterpStd 函数 使 用 Fast 解释 
髓 进行 解析 ,在 该 函数 中 通过 调用 dvmMterpStdRun 函数 来 实现 字 节 码 解 析 。 

在 解释 器 从 dvmMterpStd 函数 的 C 代码 转 入 汇编 实现 的 dvmMterpStdRun 函数 之 
前 ,需要 定义 一 个 结构 体 , 用 于 保存 当前 状态 ,如 将 要 执行 的 方法 .指令 的 入口 .堆栈 信息 等 ， 


3 让 


于 3 和 。 Android Dalvik 虚拟 机 结构 及 机 制 剖 析 一 一 第 2 卷 Dalvik 虚拟 机 各 模块 机 制 分 析 


rlBASE 
Ox00 &.L OP NOP 
Ox01 &.L OP_ MOVE 


- 工 OP NOP:/*0x00*/ 
FETCH INST_OPCODE 1 %ecx 
ADVANCE PC 1 
GOTO NEXT R %ecx 
L OP MOVE:/*0x01*/ 
movzbl rINSTbl,%eax 


Ox52 &.L OP IGET 
Ox53 | &.L_OP IGET_WIDE 


FETCH_INST_OPCODE 1%ecx 
ADVANCE_PC1 

SET_VREG rINST %eax 
GOTO_NEXT_R %ecx 


-L_OP_IGET:/*0x52#/ 
movlrSELRF'%oecx 
SPILL(rIBASE) 

movzwl 2(rPC)rIBASE 


.LOP_IGET finish: 


GOTO NEXT R %eax 


L_OP _ IGET_WIDE:/*0x53*/ 
movl rSELF,%ecx 
SPILL(rIBASE) 

movzwl 2(rPC),rIBASE 


5.11 x86 汇编 实现 指令 解释 程序 的 内 存 构 造 图 


如 代码 清单 5. 19 所 示 。 
代码 清单 5.19 dalvik/vm/interp/InterpSate.h 


struct Interpsavestate { 
Const U2* Ee sxDalvik 虚 拟 机 FC, 当 前 将 要 执行 指令 * / 
ud* CurEramey xDalvik 虚 拟 机 帧 指针 * / 
const Method ~ * method; Ax 开 始 要 被 执行 的 方法 * / 
DynDex* methodclassDex; sx 类 中 方法 的 字 节 码 * / 
JUValue retval; sx 返回 值 , 可 能 是 数值 类 型 或 对 象 * / 
void* bailPtr; sx 保持 指针 x / 


a 


在 进入 汇编 代码 之 前 会 保存 将 要 解释 的 类 的 方法 的 字 节 码 信息 ,如 代码 清单 5. 20 所 示 。 
代码 清单 $. 20 dalvik/vm/interp/Interp. cpp:dvmInterpret 

Self— > jnterpSave .method= method; 

self— > interpSave.curFrame= (04* ) self- > interpSave.curFrame; 

Self— > interpSave.pc=method- > insns; 
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a 
| 


* EResult= self— > interpSave.retval; 

/* Restore interpreter state fram previous activaticn * / 

self_ > interpSave= interpsaveState; 

根据 不 同 的 平台 实现 ,执行 相应 的 dvmMterpStrRun 函数 。 接 下 来 分 别针 对 ARM 平 
台 和 x86 平台 讲解 。 


1. ARM 平台 


针对 ARM 平台 ,Dalvik 虚拟 机 启动 时 ,需要 检查 指令 的 解释 程序 是 否 超过 大 小 , 若 有 
指令 超过 大 小 ,虚拟 机 将 报错 并 因此 退出 。 需 要 注意 的 是 ,出 错 后 并 不 提示 哪 条 指令 的 解释 
程序 出 错 了 。 

和 Portable 类 似 ,在 进入 指令 解释 前 ,需要 保存 现场 。 在 汇编 版 的 Fast 解释 器 中 则 表 
现 为 对 涉及 的 寄存 器 的 保存 。 代 码 如 代码 清单 5. 21 所 示 。 

代码 清单 5.21 dalvik/vm/mterp/out/InterpAsm-armv7-a-neon.S 


# define MIERP FNTRY] \ 

.Save {r4- rl0,fp,lr}; \ 

stmfd sp!, {r4- r10, fp, 1r} @ save 9 regs 
# define MIERP FNTRY2 \ 

.pad #4; \ 

Sub sp,sp,#4 Q@align 6 


.fnstart 
MIERP ENIRY1 
MIERP FENIRY2 


/* save stack pointer,add magic word for debuggerd * / 
str sp, [r0,# offThread bailPtr] @ save SP for eventual retum 


在 保存 完 现场 后 , 则 开始 指令 解释 ,流程 图 如 图 5. 12 所 示 。 


(人 开始 ) 


保存 9 个 寄存 器 
(r4~r10 以 及 fp,Ir) 
64B 对 齐 
保存 堆栈 
1 
加 载 pc， 得 到 取 下 一 条 指令 
函数 入 口 点 GOTO_OPCODE(ip) 
t 
取 值 执行 该 指令 
FETCH INST ™| GET INST(ip) 


5.12 Fast 解释 器 汇编 实现 执行 流程 
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汇编 版 本 实现 和 All-stubs 版 本 实现 基本 一 样 ,最 大 的 差异 在 于 汇编 版 本 不 是 用 一 个 大 
的 while 循环 来 控制 指令 的 解释 ,而 是 以 以 下 三 条 语句 开始 解释 器 的 执行 。 
代码 清单 $. 22 dalvik/vm/mterp/out/InterpAsm-armv7-a-neon. S 


FETCH IJNST () @ load rINST from rFC 
GET_INST OFOODE (ip) @ extract opcode from TINST 
GOTO OFCODE (ip) @ Jup to next instruction 


FETCH_INST 从 rPC 寄存 器 中 获取 指令 ,是 一 个 宏 定义 ,定义 如 代码 清单 5. 23 
所 示 。 
代码 清单 5.23 dalvik/vm/mterp/out/InterpAsm-armv7-a-neon.S 


# define FETCH INST() ldmh rINST, [rFC] 


Ldrh 是 ARM 指令 ,rPC 指向 的 是 字 节 码 存储 地 址 ,将 该 地 址 中 的 内 容 加 载 到 rINST 
寄存 器 中 。 之 后 用 GET_INST_OPCODE 开始 获取 指令 类 型 枚 举 值 ,其 具体 实现 也 为 一 个 
宏 定义 。 

代码 清单 5.24 dalvik/vm/mterp/out/InterpAsm-armv7-a-neon.S 


# define GET INST OPFOODE (_ reg) and _reg, rINST,# 255 


And 是 ARM 指令 ,获取 存储 在 rINST 寄存 器 中 的 字 节 码 的 操作 码 号 ,并 放置 在 _reg 
寄存 器 中 ，reg 将 被 替换 为 ip。 最 后 跳 转 到 该 字 节 码 对 应 的 解释 程序 处 开始 解释 。 

正如 前 文 所 说 ,ARM 中 采用 的 是 computed-goto 机 制 , 每 块 解释 程序 都 被 放置 在 64B 
的 内 存 中 ,不 满 空 着 ,超出 则 另 加 。GOTO_OPCODE 需要 根据 以 下 公式 计算 得 到 指令 解释 
程序 地 址 。 


dAsmInstructionStart+ OPX 64 


反映 在 代码 上 则 如 代码 清单 5. 25 所 示 。 
代码 清单 5.25 dalvik/vm/mterp/out/InterpAsm-armv7-a-neon.S 


#define GOTO_ OPOODE (_reg) Ess| Pc,rIEASE, reg,lsl #6 

在 每 条 指令 执行 结束 后 ,依然 是 取 值 、 跳 转 、 执 行 三 个 步骤 ,实现 上 和 上 面 略 有 差别 ,可 
以 看 到 和 Portable 标签 有 点 类 似 ,也 是 在 每 条 指令 解释 程序 完成 前 进行 取 指 并 跳 转 。 直 至 
解释 结束 。 

代码 清单 5.26 dalvik/vm/mterp/out/InterpAsm-armv7-a-neon. S 


FEETCH ADVANCE INST(1) @ advance rFC, load rINST 
GET VREG(r2,71) @r2< -fp[B] 

GET_INST OFOODP (ip) @ ip< -cpcode from TINST 
2. x86 平台 


从 函数 dvmInterp 进入 面向 x86 平台 的 Fast 解释 器 的 汇编 实现 的 dvmMterpStdRun 
函数 开始 解析 ,其 字 节 码 解析 流程 如 图 5. 13 所 示 。 
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保存 机 制 指针 
获取 当前 线程 


堆栈 16 位 对 齐 
寄存 器 偏 移 


设置 [FP 、rPC 寄 存 
器 的 值 ， 将 rIBASE 
对 应 到 curHandler 


取 指 、 跳 转 


5.13 面向 x86 平台 指令 解析 流程 图 


从 流程 图 中 可 看 到 ,在 取 指 解释 之 前 需要 对 特定 功能 的 寄存 器 初 值 进行 设置 ,如 rPC 
是 程序 计数 器 ,使 用 offThread_pc 设置 ,其 定义 如 下 。 
代码 清单 5.27 dalvik/vm/mterp/out/InterpAsm-x86.S 


MIERP OFFSET (offThread pc, Thread, interpSave.pc, 0) 

最 终 这 个 宏 定 义 会 生成 一 个 常量 标签 即 : offThread_pc 二 0。 类 似 的 还 有 栈 帧 rFP、 堆 
栈 基 址 rIBASE。 

代码 清单 $. 28 dalvik/vm/mterp/out/InterpAsm-x86.S 


MIERP OFFSFT (offThread curFrame, Thread, interpSave.curFrame, 4) 
MIERP_OFFSET (offThread curHandlerTable, Thread, interpBreak.ctl.curHandlerTable, 44) 


这 里 需 注意 的 是 ,curHandlerTable 结构 体 interpBreak 的 成 员 , 这 一 结构 体 用 于 解释 
程序 的 控制 ,其 包含 解释 器 模式 信息 , 即 线程 被 挂 起 的 次 数 , 当 降 到 0 时 ,线程 重启 。 而 数组 
curHandlerTable 则 指示 当前 的 执行 表 。 

程序 准备 完毕 后 ,使 用 以 下 两 条 语句 开始 解释 器 的 执行 。 

(1) FETCH_INST: 和 ARM 平台 类 似 , 只 是 宏 定 义 不 再 相同 。 从 程序 计数 器 rPC 中 
获取 下 一 条 指令 存 人 rINST 中 ,并 不 调整 rPC, 该 安定 义 如 下 。 

代码 清单 $. 29 dalvik/vm/mterp/out/InterpAsm-x86.S 

macro FETCH INST 

a (rEC) ,rINST 


(2) GOTO_NEXT: 获取 操作 码 并 根据 操作 码 进 行 跳 转 执行 ,该 宏 定义 如 下 。 
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代码 清单 5.30 dalvik/vm/mterp/out/InterpAsm-x86.S 


-Iacro GOTO NEXT 
mVvzx IINSTDb]l,%eax 
Imovzbl rINSTHh, rINST 
jnmp x* (rIBASE,Seax,4) 
-engm 


在 GOTO_NEXT 宏 的 定义 中 ,首先 获取 指令 的 操作 码 rINSTbl 存 人 %eax 寄存 器 ,之 
后 获取 指令 的 操作 数 rINSTbh ,通过 jmp 跳 转 指令 跳 转 到 rIBASE 十 %eaxX4 的 地 址 开始 
执行 解析 。 
在 每 条 指令 执行 结束 后 ,依然 是 取 值 . 跳 转 执行 ,实现 上 和 上 面 略 有 差别 ,可 以 看 到 和 
Portable 标签 有 点 类 似 , 也 是 在 每 条 指令 解释 程序 完成 前 进行 取 指 跳 转 。 
(1) FETCH_INST_OPCODE 获取 操作 码 存 人 指定 寄存 器 。 
代码 清单 5.31 dalvik/vm/mterp/out/InterpAsm-x86.S 
.Macro FETCH INST OPOOTE count reg 
movzabl \_oount* 2(rPC),\_reg 
FETCH_INST_OPCODE 获取 操作 码 并 存 人 _reg, 这 个 指令 必须 与 GOTO_NEXT_R _reg 
一 起 使 用 。 
(2) GOTO_NEXT_R 实现 指令 的 跳 转 , 定 义 如 下 。 
代码 清单 5.32 dalvik/vm/mterp/out/InterpAsm-x86.S 
-macro GOTO NEXT R_reg 
movzbl 1(rEC) ,TINST 
jmp * (IEASE,\ reg,4) 
-endm 
最 后 跳 转 到 rIBASE 十 \_regX4 处 执行 。 
指令 跳 转 采用 的 是 jump-table。 指 令 解 释 程 序 的 地 址 从 dvmAsmInstructionStart 地 址 
处 按 如 下 方式 排列 ,每 个 指令 解释 程序 的 地 址 占 4B, 并 且 以 rIBASE 作为 指令 解释 程序 的 
基 址 ,因而 ,对 于 操作 码 为 外 eax 的 指令 其 对 应 解释 程序 的 地 址 为 : rTIBASE 十 %eaxX4。 


5.5.3 一 个 解释 程序 的 例子 


在 x86 平台 下 以 算术 运算 为 例 ,在 vm/mterp/out 文件 夹 下 的 x86 平台 实现 InterpAsm- 
x86.S 文件 中 可 以 找到 ,对 于 算术 加 ` 减 . 乘 、 除 的 简单 运算 指令 解释 程序 分 别 进行 了 单独 的 
实现 ,与 Portable 解释 器 的 算术 运算 解释 程序 调用 同一 个 宏 不 同 ,每 个 运算 单独 的 指令 解 
释 程序 减少 了 解释 程序 的 判断 复杂 的 判断 逻辑 ,实现 简单 .其 中 乘法 代码 如 下 。 

代码 清单 5.33 dalvik/vm/mterp/out/InterpAsm-armv7-a-neon. S 


-OP MIL INT: /* Ox92 */ 
movzbl ”2(rPC) ,geax # 取 得 第 一 个 操作 数 
movzbl ”3(rEC) ,gsecx # 取 得 第 二 个 操作 数 
GET VREG R Seax Seax 取得 操作 数 seax 的 值 
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SEILD (CIBASP) ## 设 置 基 址 FIBASE 
jnmnll (rEP,Secx,4),Seax 坦 计 算 操作 
UNSPITL (rTPASE) # 重 置 基 址 rTIEASE 
FETCH INST OPOOE 2 Secx # 获 取 下 一 操作 码 
AIWANCE PC 2 # 调 整 EC 

SET VREG %eax rINST # seax 存 储 结 果 
GOTO NEXT R Secx # 跳 转 下 一 条 指令 


从 代码 中 可 以 看 到 ,首先 获取 操作 数 存 人 寄存 器 %eax 和 %ecx 中 ,得 到 %eax 寄存 器 
中 的 值 ,调整 基 址 偏 移 量 ,使 用 imull 指令 进行 乘法 运算 ,重新 调整 基 址 ,使 用 FETCH_ 
INST_OPCODE 获取 下 一 条 指令 ,ADVANCE_PC 调整 程序 PC,SET_VREG 将 计算 结果 
存 人 指令 寄存 器 中 ,GOTO_NEXT_R 跳 转 到 下 一 条 指令 执行 。 对 于 加 、 减 运算 ,只 需 将 其 
中 的 imull 指令 替换 为 addl 和 subl 指令 即 可 ,而 对 于 除法 指令 , 则 需 进行 一 些 判 断 ,这 一 过 
程 与 Portable 解释 器 的 对 除法 进行 解释 的 流程 相似 . 故 不 再 详 述 。 

在 InterpAsm-x86. S 文件 中 的 指令 解释 程序 与 此 类 似 。 有 些 指令 解释 程序 会 涉及 一 些 
错误 处 理 的 情况 ,如 在 除法 中 ,如 果 除 数 为 0, 则 会 报错 ,用 common_errDivideByZero 错误 
处 理 , 其 定义 如 下 。 

代码 清单 5.34 dalvik/vm/mterp/out/InterpAsm-armv7-a-neon. S 

camon errDivigeByZero: 

ExEORT FC 

movl $ .LstrDivideByZero, Seax 
movl Seax, OUT_ARGO (sesp) 

call 。 dmtmhrouarithmeticException 
jmp Comon_ exoeptionThrom 

在 其 中 会 调用 到 C 代码 编写 的 函数 dvmThrowArithmeticException ,用 来 抛 出 异常 。 
这 与 Portable 解释 器 一 致 。 


5.6 解释 器 的 模块 化 设计 


解释 器 采用 了 模块 化 的 方法 ,允许 开发 特定 于 平台 的 代码 ,使 得 汇编 语言 编写 的 解释 器 
更 容易 移植 和 调试 。 每 个 指令 解释 程序 都 是 单独 的 文件 ,包括 解释 器 的 入 口 函 数 、 出 口 函 数 
以 及 宏 定 义 , 可 以 根据 要 求 编写 配置 文件 ,从 而 得 到 相应 平台 的 目标 代码 。 

vm/mterp 文件 夹 包含 Dalvik 解释 器 的 实现 代码 ,包括 解释 器 的 C 语言 实现 和 汇编 实 
现 。 在 该 文件 夹 下 每 个 平台 对 应 一 个 单独 文件 夹 ,文件 夹 中 是 这 个 平台 相应 操作 的 代码 片 
段 ,包括 实现 Portable 解释 器 的 C 代码 文件 ,实现 Fast 解释 器 中 针对 ARM 和 x86 平台 的 
汇编 代码 文件 。 官 方 的 源 代码 中 已 经 有 以 下 几 种 平台 的 汇编 实现 : DARM v5te; @ARM 
v6; @ARM v6t2; @ARM v7-a; @ARM-vfp; @x86。 不 在 以 上 几 种 平台 的 ,可 以 用 C 语 
言 实现 的 解释 器 ,该 版 本 解释 器 是 对 所 有 平台 都 通用 的 。 

在 解释 器 中 使 用 配置 文件 来 控制 按照 一 定 的 规则 组 织 C 代码 片段 或 汇编 代码 片段 以 
生成 对 应 类 型 或 平台 的 解释 器 代码 。 在 mterp 目录 下 包括 针对 提 及 平台 和 类 型 的 解释 器 配 
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置 文件 ,都 以 "config-” 开 头 , 源 代码 被 写 入 out 文件 夹 目录 下 。 
接 下 来 说 明 配置 文件 的 格式 。 配 置 文件 自 顶 向 下 解析 ,在 文件 中 每 一 行 上 只 有 三 种 可 能 ， 
@ 空 行 ; 四 注释 ; 图 命令 。 配 置 文件 要 求 可 以 填写 以 下 几 种 命令 中 的 全 部 或 部 分 。 


1. handler-style=computed-goto |jump-table|all-c> 


该 参数 用 来 控制 解释 器 的 执行 方式 ,分 别 是 计算 得 到 操作 码 解释 程序 地 址 (computed- 
goto) ,采用 跳 转 表 跳 转 到 操作 码 解释 程序 (jump-table) 以 及 采用 C 函数 方式 来 实现 (all-c)。 
computed-goto 中 ,所 有 的 操作 码 解释 程序 都 被 分 配 到 固定 的 地 址 ,每 段 解释 程序 都 要 小 于 
一 定 大 小 ,一般 采用 的 是 64B。 在 解析 时 ,通过 计算 table-start-addres(opcode * handler- 
size) 来 得 到 解释 程序 地 址 。jump-table 则 是 根据 操作 码 跳 转 到 相应 程序 的 解释 程序 ,所 以 
解释 程序 可 以 是 任意 大 小 的 。all-c 参数 则 是 为 Portable 解释 器 准备 的 。 需 要 注意 的 是 ,该 
命令 是 必要 的 , 且 必 须 是 配置 文件 的 第 一 条 命令 。 


2. handler-size—bytes> 


该 命令 提供 了 一 个 值 ,以 bytes 为 单位 。 汇 编 实现 的 解释 程序 占用 的 大 小 。 在 大 部 分 
的 平台 上 ,该 值 应 该 是 2 的 寡 。 需 注意 ,该 命令 是 与 computed-goto 类 型 搭配 使 用 的 ,对 于 
jump-table 和 all-c 实现 是 没有 用 的 。 


3. import=<filename> 


指定 的 文件 中 所 有 的 内 容 将 会 拷贝 到 输出 文件 中 。 以 “. cpp” 和 “. h” 为 后 级 的 文件 将 
会 拷贝 到 C 文 件 中 ,以 “. S” 为 后 级 则 会 拷贝 到 汇编 文件 中 。 


4. asm-stub=filename> 


该 命令 将 会 拷贝 给 定名 字 的 文件 , 写 人 到 输出 文件 时 ,会 将 操作 码 名 称 进行 替换 。 主 要 
完成 的 是 汇编 实现 调用 C 语言 函数 。 注 意 该 命令 不 适用 all-c 实现 。 


5. asm-alt-stub=filename> 


对 于 computed-goto 实现 ,将 会 生成 一 系列 的 入 口 点 ,对 于 jump-table 实现 , 则 会 生成 
一 张 可 选择 的 跳 转 表 。 


6. op-start<directory> 


表示 开始 生成 操作 码 解释 程序 。 根 据 配 置 文 件 指定 的 目标 平台 找到 当前 目录 下 相应 的 
文件 夹 , 该 文件 夹 存储 了 一 系列 以 “op” 开 头 的 文件 ,分 别 对 应 各 个 解释 程序 的 实现 。 


7. op=opcode>=directory> 


将 会 用 指定 路 径 下 的 文件 替换 掉 默 认 文件 ,相应 的 代码 片段 也 将 被 蔡 换 掉 。 该 参数 必 
须 在 op-start 命令 后 ,在 op-end 命令 前 。 
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8. alt<opcode>=directory> 
和 前 述 op 命令 一 样 , 只 不 过 替换 的 是 选择 表 。 
9. op-end 


操作 码 列 表 结 束 。 所 有 的 操作 码 的 解释 程序 都 已 经 写 到 输出 文件 。 任 何其 他 不 满足 空 
间 限 制 的 程序 (64B) 就 跟 在 操作 码 列 表 后 。 

对 于 每 个 特定 的 目标 平台 均 有 一 个 对 应 的 配置 文件 ,控制 生成 两 个 输出 文件 InterpC- 
< 一 arch 盖 .C 和 InterpAsm<arch 盖 .S。 配 置 文件 经 由 gen-mterp. py 脚本 进行 解析 ,生成 相 
应 的 解释 器 代码 。 依 赖 Python 脚本 文件 处 理 功 能 ,使 得 解释 器 的 移植 难度 大 大 降低 了 。 
该 脚本 的 用 法 是 : 


Python gen- mterp.py [平台 版 本 ] 只 出 目录 ] 


接 下 来 分 析 gen-mterp. py 脚本 的 实现 原理 。 

首先 通过 获取 系统 参数 得 到 目标 平台 的 版 本 target_arch 及 输出 文件 目录 output_dir， 
获取 操作 码 opcodes 列表 ,打开 目标 平台 的 配置 文件 ,以 写 的 方式 打开 输出 文件 夹 下 的 所 应 
生成 的 针对 目标 平台 的 文件 (包括 . cpp 和 .s 文 件 ) 。 

config fp= apen("config- %s" $target arch) 

c_fp= open (gs/Interpc- ss.qpp"s (output dir, target arch) ,™w") 

asm_ fp- open ("%s/Interpnsm %s.s" $ (output dir, target arch),"w") 

以 上 准备 工作 完成 后 ,开始 生成 目标 平台 的 代码 。 生 成 输出 文件 的 头 部 注释 部 分 ,得 到 
配置 文件 的 指针 , 读 取 配置 文件 的 内 容 , 空 行 和 注释 行 跳 过 ,判断 命令 是 否 为 :“handler- 
size” “import” “asm-stub”, “asm-alt-stub”, “op-start”, “op-end”, “alt”、 “op”, “handler- 
style” 字 符 串 , 对 应 调用 setHandlerSize (tokens ) 、importFile (tokens)、setAsmStub 
(tokens) setAsmAltStub (tokens) 、opStart (tokens)、opEnd(tokens) altEntry(tokens )、 
opEntry(tokens) ,setHandlerStyle(tokens) 函数 来 执行 相应 字符 串 的 功能 。 这 些 函 数 在 脚 
本 中 已 定义 ,用 来 实现 相应 的 功能 。 若 判断 的 命令 不 包含 在 以 上 字符 串 中 , 则 报 出 命令 错误 
的 异常 。 最 后 关闭 文件 指针 ,代码 生成 完毕 。 

通过 gen-mterp. py 脚本 会 生成 特定 平台 的 . S 文件 和 .C 文件 。 

系统 通过 运行 rebuild. sh 会 生成 所 有 目标 平台 的 代码 : 

for ardh in portable allstibs ammv5te amv5te- vip amv7- a amv7- a- neon x86 x86- atam; do TARGET ARCH ET 

=$ ard make- f Makefile- mterp;done 


代码 中 通过 Makefile-mterp 文件 来 完成 代码 的 生成 ,在 Makefile-mterp 文件 中 指定 目 
标 平台 和 输出 目录 ,通过 调用 gen-mterp. py 脚本 完成 生成 : 
/gen- mterp.py$ (TARGET ARCH FXT)$ (OUTPUT DIR) 


由 于 Portable 解释 器 只 针对 C 实现 ,因此 其 生成 的 汇编 文件 没有 意义 ,在 rebuild. sh 
脚本 中 将 其 除去 : 
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Im-Efout/Interpasm Portable.S 

由 于 解释 器 的 模块 化 设计 , 若 要 生成 针对 特定 平台 的 代码 ,只 需要 更 改 相关 的 参数 或 增 
加 部 分 代码 片段 即 可 通过 上 述 的 方法 生成 新 的 平台 代码 ,而 不 必修 改 庞大 的 生成 代码 。 这 
对 解释 器 在 不 同 平台 上 的 移植 提供 了 方便 。 


小 结 
本 章 分 别 讲解 了 Dalvik 的 三 种 解释 器 实现 ,Portable、C 实现 Fast 和 汇编 实现 Fast。 


就 这 三 种 解释 器 实现 的 不 同和 使 用 场景 的 不 同 进行 了 深入 阐述 。 最 后 详细 说 明了 如 何 通过 
脚本 实现 了 解释 器 的 模块 化 设计 。 


加 第 6 但 Eo 
即时 编译 模块 的 原理 及 实现 


本 章 主要 内 容 


避 什 么 叫 JIT? 

如 JIT 有 哪些 类 型 ? 

如 Dalvik JIT 的 整体 工作 流程 是 怎样 的 ? 
?Dalvik JIT 是 如 何 和 解释 器 耦合 的 ? 
本 Dalvik JIT 的 前 后 端 是 如 何 衔接 的 ? 
如 Dalvik JIT 的 前 端 部 分 是 如 何 工作 的 ? 
名 Dalvik JIT 的 后 端 部 分 是 如 何 工作 的 ? 


众所周知 ,程序 执行 有 两 种 方式 ,分 别 为 解释 和 编译 。 解 释 方式 是 逐 句 读 取 源 程序 逐 名 
翻译 成 机 器 码 再 执行 ;而 编译 方式 则 是 在 运行 程序 前 ,将 整个 程序 翻译 为 等 价 的 目标 程序 ， 
计算 机 直接 执行 该 目标 程序 。JIT 混合 了 两 种 技术 ,解释 器 解释 时 ,编译 部 分 程序 ,并 在 下 
次 直接 执行 该 编译 后 的 源 程 序 。 


6.1 概述 


JIT(Just-In-Time) ,中 文 含义 为 即时 编译 ,又 称 为 动态 编译 ,执行 时 动态 地 编译 程序 ， 
以 缓解 解释 器 的 低 效 工作 。 对 于 Java 这 类 语言 来 说 ,经 过 编译 后 ,将 生成 和 平台 无 关 的 中 
间 代 码 。 不 同 平台 上 的 虚拟 机 (JVMD) 都 可 以 执行 相同 的 Java 中 间 代 码 , 同 时 需要 处 理 和 操 
作 系 统 和 硬件 平台 相关 的 部 分 。 这 也 是 大 多 数 解释 型 语言 采用 的 模型 。 虚 拟 机 中 最 主要 的 
是 解释 器 ,负责 解释 执行 中 间 代码 。 

虽 有 跨 平 台 的 优势 ,但 同时 也 带 了 运行 效率 低 的 直观 感受 。 究 其 原因 ,是 因为 其 执 
行 原理 是 一 句 一 句 翻译 字 节 码 。 比 如 , 字 节 码 中 出 现 循环 ,根据 解释 器 的 原理 , 它 需 要 
重复 地 解释 并 执行 这 一 组 程序 。 这 使 得 纯粹 基于 解释 器 运行 的 程序 效率 十 分 低下 , 造 
成 了 浪费 。 

JIT 是 解决 这 个 缺陷 的 一 种 有 效 手段 。 通 过 将 字 节 码 编译 为 Native Code, 让 解释 器 不 
再 重复 执行 这 些 热点 代码 片段 。 而 且 , 相 比 于 解释 器 ,JIT 编译 器 可 以 更 高 效 地 利用 CPU 
和 寄存 器 。 同 时 在 编译 的 过 程 中 ,可 以 进行 部 分 低级 代码 优化 ,比如 常数 传播 .取消 范围 检 
查 、 复 制 传播 等 。 尽 可 能 地 生成 媲美 编译 器 编译 的 二 进 制 代码 。 之 后 执行 编译 生成 的 
Native Code, 从 而 达到 加 速 执行 应 用 程序 的 目的 。 

但 需要 注意 的 是 ,JIT 也 不 是 万 能 的 。 引 入 JIT 将 会 消耗 额外 的 时 间 和 空间 。 相 比 于 
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正常 的 解释 执行 ,如 果 JIT 编译 消耗 的 时 间 并 没有 占有 优势 ,引入 JIT 不 仅 不 会 提升 程序 执 
行 性 能 ,反而 会 降低 。 

点 拨 ”一 些 现代 的 解释 器 一 般 都 包含 JIT 模块 。 其 实 , 在 互联 网 如 此 发 达 的 现在 ,我 们 
几乎 无 时 无 刻 地 在 接触 JIT, 因 为 浏览 器 为 提升 JavaScript 解析 速度 ,大 量 使 用 了 JIT 技术 。 


6.2 JIT 分 类 


根据 JIT 编译 热点 代码 的 粒度 不 同 ,JIT 可 以 分 为 两 类 ,分 别 是 Method-based JIT 和 
Trace-based JIT。 下 面 就 两 类 JIT 分 别 介绍 其 特点 。 


6.2.1 Method-based JIT 


所 谓 Method-based JIT, 是 说 筛选 的 热点 代码 的 粒度 是 方法 级 的 。Method-based 中 的 
Method 指 Java 代码 中 的 方法 或 函数 。Method-based JIT 通常 在 服务 器 端 使 用 。 在 解释 器 
执行 过 程 中 ,解释 器 探测 发 现 热 方 法 ,然后 编译 并 优化 被 探测 到 的 热 方 法 。 

由 于 Method-based JIT 编译 的 是 整个 方法 ,除去 函数 参数 和 返回 值 外 ,函数 内 部 和 郴 
数 外 没有 数据 依赖 。 这 使 得 JIT 在 编译 过 程 中 更 容易 .更 彻底 地 优化 ,编译 后 的 Native 
Code 的 执行 效率 也 就 更 高 。 但 是 Method-based JIT 在 编译 和 优化 时 也 占用 了 更 多 的 内 
存 , 且 预 热 的 速度 相对 来 说 比较 慢 ,程序 的 高 速 运转 需要 前 期 较 高 的 投入 。 

当前 Oracle 公司 的 HotSpot 技术 即 是 用 了 Method-based JIT。 在 其 中 每 个 方法 对 应 
一 个 计数 器 , 当 其 大 于 阅 值 (Cl 为 1500,C2 为 10 000) 时 ,表示 该 方法 已 经 够 “ 热 ”, 并 触发 
HotSpot JIT 开始 工作 。 

点 拨 ”HotSpot VM 的 编译 器 有 Client Compiler 和 Server Compiler, 简称 为 C1 和 C2 编译 
器 。C1l 编译 器 的 优化 比较 快 ,C2 编译 器 能 产生 更 好 的 代码 ,但 是 优化 的 速度 就 比较 慢 。 


6.2.2 Trace-based JIT 


同样 地 ,Trace-based JIT 筛选 的 热点 代码 是 以 Tace 为 粒度 。Trace-based 中 的 Trace 指 
的 是 一 段 代码 序列 。 解 释 器 探测 发 现 “ 热 ”执行 路 径 , 编 译 并 优化 这 一 小 段 “ 热 ”的 小 块 程序 。 

相 比 于 Method-based JIT, 其 有 优化 粒度 较 细 、 额 外 内 存 开销 小 、 编 译 热 代 码 速度 快 .与 
解释 器 之 间 的 过 渡 平滑 等 优点 。 和 Method-based JIT 不 同 ,前 期 预 热 快 ,可 以 非常 快 地 体 
现 出 性 能 提升 。 这 也 是 为 什么 其 适合 嵌入 式 或 手持 设备 等 资源 比较 紧张 . 功 耗 要 求 高 的 平 
台 。 但 同时 , 因 其 细 粒 度 编译 和 优化 ,无 法 有 顶峰 的 执行 速度 ;频繁 地 在 由 解释 器 执行 和 执 
行 Native Code 之 间 转 换 需 要 更 多 的 状态 同步 。 

而 Dalvik VM 使 用 的 平台 基于 电池 ; 相 比 于 PC, 内 存 资源 和 CPU 资源 略 显 不 足 ; 需 要 
考虑 到 自身 的 安全 性 ;在 手持 设备 上 需要 快速 地 达到 加 速效 果 以 及 平滑 的 过 渡 于 解释 器 和 
Native Code 之 间 。 因 而 ,最 终 其 采用 的 是 Trace-based JIT。Google 在 2010 年 IO 会议 上 
给 出 了 一 份 统计 数据 ,如 图 6. 1 所 示 。 

从 图 中 可 以 看 到 ,虽然 Method-based JIT 有 更 好 的 优化 窗口 ,但 是 Trace-based JIT 需 
要 的 内 存 更 少 ,编译 的 速度 更 快 。 
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Full Program 
4695 780B 


Method JIT: 

Best optimization window 
Trace JIT: 

Best Speed/space tradeoff 


上 
Hot Methods 
天 


8% of Program 


Hot Traces 
103 966B 
26% of Hot Methods 
2% of Program 


图 6.1 热 方法 和 热 路 径 的 比例 


6.3 整体 框架 分 析 


Dalvik 虚拟 机 从 Android 2. 2 开始 支持 JIT, 以 一 个 组 件 的 形式 增加 了 JIT 编译 模块 ， 
并 可 在 编译 时 选择 是 否 开启 。Android 应 用 程序 的 执行 性 能 由 此 提高 了 2 一 5 倍 。 因 为 
Dalvik JIT 执行 环境 的 特殊 性 (移动 平台 .手持 设备 . 受 电池 限制 ) ,需要 平衡 以 下 几 个 限制 ; 
中 相 比 原来 的 解释 器 , 尽 可 能 地 减少 内 存 开销 ; @@ 和 Dalvik 基于 沙 盒 的 安全 模型 兼容 
@ 尽 快 地 提高 执行 性 能 ; 四 平滑 地 在 解释 器 和 编译 后 的 代码 之 间 过 渡 。 考 虑 到 以 上 因素 ， 
Dalvik JIT 采用 的 是 Trace 粒度 的 编译 方式 。 

Dalvik VM 中 JIT 编译 器 只 和 解释 器 之 间 有 上 比较 紧密 的 耦合 , 且 两 者 是 属于 不 同 的 线 
程 。 解 释 器 在 解释 时 筛选 出 频繁 执行 的 代码 段 ,构造 路 径 , 并 交 由 JIT 编译 器 编译 成 本 地 代 
码 ; 编 译 后 的 代码 缓存 到 内 存 中 ,下 次 执行 到 相同 的 字 节 码 时 ,可 以 直接 执行 编译 好 的 本 地 
代码 。 如 图 6.2 所 示 ,Dalvik JIT 编译 器 包含 基本 块 构造 .SSA 转换 .优化 .MIR 转 LIR 以 
及 LIR 转换 为 Native Code 这 几 个 部 分 。 其 中 Dalvik JIT 实现 了 包括 寄存 器 分 配 、 宛 余 内 
存 操作 指令 消除 .元 余 有 效 性 检查 消除 等 优化 ,同时 ,特别 优化 了 循环 。 其 主要 的 调用 人 口 
为 dalvik/compiler/Frontend. cpp 中 的 dvmCompilerTrace 函数 。 

点 拨 Dalvik 内 部 包含 许多 线程 ,同时 为 保证 启动 效率 ,所 有 线程 并 不 是 同时 建立 的 ， 
具体 请 阅读 dalvik/vm/Init. cpp 中 的 初始 化 过 程 。 

Dalvik JIT 在 Zygote 启动 后 ,通过 dvmCompilerStartup 函数 建立 JIT 线程 并 初始 化 
JIT。VM 为 Dalvik JIT 维护 一 个 gDvmjit 结构 体 , 其 中 包含 保存 JIT 入 口 地 址 的 Hash 
表 、 保 存 二 进 制 代 码 的 入口 地 址 等 重要 的 信息 。Dalvik VM 关闭 时 ,该 结构 体 将 被 释放 。 结 
构 体 定义 如 代码 清单 6. 1 所 示 。 

代码 清单 6.1 dalvik/vm/Globals.h:DvmJitGlobals:DvmJitGlobals 


struct DumJitclcbals { 
struct JitEntry * pJitEntryTable; // 入 口 表 ,每 个 Trace 对 应 一 个 人 口 
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unsigned char * pprofTable; // 国 值 计 数 器 
unsigned int jitTablesize; // 可 以 使 用 的 入 口 表 大 小 
unsigned int jitTableFntriesUsed; // 入 口 表 使 用 情况 
void * codeCachey // 编 译 后 的 代码 存放 地 址 
wsigned int codeCcachesize; //code caqhe 总 大 小 
unsigned int codeCacheByteUsed; /人 已 经 使 用 的 code cace 大 小 
} 
三 Dalvik VM 
解释 器 JIT 编 译 器 
基本 块 构造 
待 编译 Trace 队 列 EC 
优化 
编译 后 的 Native Code MIR 转 LIR 
Assemble LIR 


7 
6.2 Dalvik VM 中 解释 器 和 JIT 编译 器 间 关 系 


工作 环境 设置 好 后 ,其 工作 框图 如 图 6. 3 所 示 。 


继续 解释 ， 直 
( 开始 ) 下 个 可 能 | 1 - Translation Cache 
Trace 头 部 
| | a 
要 新 生机 Translation Translation 
计数 器 
i - 
Exit 0 Exit 0 
Exit 1 Exit1 =] 
建立 Trace 
发 送 编译 请 求 Translation 
1 
编译 线程 安装 映 译 好 的 Native Code ~| Exit0 
Exit 1 


6.3 Dalvik JIT 工作 框图 


首先 , 先 简略 地 解释 下 这 个 工作 框图 。 在 开始 处 ,解释 器 正在 解释 执行 字 节 码 。 当 其 识 
别 到 某 些 特定 的 指令 时 ,更 新 这 些 指令 对 应 的 计数 器 ;并 调用 dvmCheckJit 函数 检测 这 些 指 
令 的 执行 次 数 是 否 达到 了 阔 值 ;达到 阔 值 后 ,首先 需要 验证 这 段 代 码 是 否 已 被 编译 为 二 进 制 
代码 ,对 于 没有 被 编译 的 Trace, 发送 编译 请 求 并 构造 Trace。 在 此 过 程 中 ,解释 器 执行 的 每 
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条 字 节 码 都 需要 指令 检查 ,如 果 符 合 要 求 ,就 加 入 Trace 中 ,直到 遇 到 终止 条 件 。 路 径 构 造 
结束 后 ,将 筛选 出 的 Trace 加 入 待 编译 队列 。 到 这 里 为 止 ,解释 器 也 就 结束 了 ,并 且 开 始 正 
常 解释 字 节 码 , 不 再 进行 指令 检查 。 
接 下 来 ,让 我 们 一 窥 这 里 涉及 的 一 些 设 计 和 代码 实现 上 的 细节 。 
首先 读者 可 能 疑惑 的 是 : 什么 是 特定 的 指令 ? 在 构造 Trace 时 ,Dalvik 解释 器 识别 的 
所 谓 特定 指令 如 表 6. 1 所 示 。 从 中 可 以 看 出 这 些 指 令 都 是 跳 转 指令 ,Dalvik JIT 假定 跳 转 
指令 之 后 的 代码 是 热 代码 的 可 能 性 比较 大 。 也 就 是 这 些 指令 之 后 执行 的 指令 是 “ 热 代码 ”的 
可 能 性 比较 大 。 
表 6.1 识别 指令 
指 令 指令 类 型 

OP_GOTO 

OP_GOTO_16 GOTO 指令 

OP_GOTO_32 

OP_PACKED_SWITCH 

OP_SPARSE_SWITCH 

OP_IF_EQ 

OP_IF_NE 

OP_IF_LT 

OP_IF_GE 

OP_IF_GT 

OP_IF_LE 

OP_IF_EQZ 

OP_IF_NEZ 

OP_IF_LTZ 

OP_IF_GEZ 

OP_IF_GTZ 

OP_IF_LEZ 


SWIFCH 指令 


IF 指令 


那 又 怎么 知道 当前 执行 的 指令 是 特殊 的 呢 ? 在 Dalvik JIT 中 ,这 些 指令 的 识别 并 不 需 
要 判断 ,而 是 通过 宏 WITH_JIT 控制 ,强制 集成 在 解释 器 相应 的 汇编 代码 中 ,每 次 执行 之 时 
都 需要 执行 判断 是 否 到 达 阔 值 的 程序 。 比 如 对 于 OP_GOTO 指令 ,如 代码 清单 6. 2 所 示 。 
代码 清单 6.2 dalvik/vm/mter p/InterpAsm-armv7-neon. S 


-OP GOTO: /* 0x28 < / 
/* File: amv5te/OP GOTO.S * / 


#if defined (WITH JIT) 

dr T0, [rSETF,# offIhread pJitProfTable] 

bmi camon testUpdateProfile @ (r0) heck for trace hotness 
#endif 
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接 下 来 的 问题 是 : 如 何 知 道 这 些 指 令 执行 的 次 数 ? Dalvik VM 维护 了 一 张 哈 希 表 , 以 
这 些 指令 的 PC 值 为 Hash 索引 ,存储 了 对 应 的 执行 次 数 。 需 要 注意 的 是 , 阔 值 在 Hash 表 
中 并 不 是 从 0 开始 ,而 是 以 国 值 开 始 ,逐渐 递减 。 当 Hash 表 中 存储 的 计数 器 递减 到 0 时 ， 
表示 已 经 达到 构建 Trace 的 要 求 。 以 armv7-a-neon 平台 为 例 , Hash 表 存 储 于 gDvmjit 中 ， 
名 为 pJitProftable。 将 PC 值 加 载 到 r3 寄存 器 后 , 移 位 计算 并 加 载 至 rl 寄存 器 ,以 armv7- 
a-neon 平台 为 例 , 这 部 分 代码 在 common_updateProfile 标签 处 ,如 代码 清单 6. 3 所 示 。 

代码 清单 6.3 dalvik/vm/mter p/InterpAsm-armv7-neon. S 


Apx Hash 阐 值 和 pc 值 有 关 */ 
eor I3, rEC, rEC, 1sr # 12 @ cheap,but fast hash function 
1sl r3,r3,# (32 ~ JIT PROF SIZE IOG 2) @ shift out excess bits 
/* 取得 阔 值 * / 
ldrm rl,[r0,r3,1sr # (32 -JIT PROF SIZE IOG 2)] @ get counter 
GET INST OFOOTE (ip) 
Ax 更 新 闻 值 ,递减 * / 
subs rl,rl,#1 @ decrement counter 
px 回 存 */ 
strb rl,[r0,r3,1sr # (32 -JIT PROF SIZE IOG 2)] @and store it 
Ax 判 断 是 否 达 到 阅 值 , 没 达到 则 回 到 解释 器 ,继续 解释 执行 * / 
GOIO OPOODE, IFNE (ip) @ if not threshold, fallthrough otherwise * / 
其 中 在 ARM 汇编 中 涉及 的 一 个 变量 是 offThread_pJitProfTable, 在 C 中 对 应 的 变量 
是 pJitProfTable。 这 是 个 数组 名 称 , 也 就 是 上 述说 过 的 存储 pc 对 应 的 threshold 值 。 
不 同 的 平台 具有 不 一 样 的 阔 值 ,主流 几 个 平台 的 阔 值 如 表 6. 2 所 示 。 
指令 到 达 阅 值 后 ,解释 器 需要 判断 Trace 是 否 被 编译 。 验 证 代码 段 是 否 被 编译 过 的 过 
程 是 ,查找 Hash 表 , 如 果 Trace 已 经 被 编译 , 则 地 址 不 为 空 ,直接 跳 转 执行 ,否则 解释 器 继 
续 执 行 ,编译 线程 继续 工作 。 如 果 没 有 编译 ,将 置 位 解释 器 中 相应 标志 位 ,解释 器 发 出 构造 


Trace 请 求 。 这 个 过 程 如 图 6.4 所 示 。 
重 设 阔 值 


调用 C 函 数 ， 获 得 
Native Code 内 存 地 址 
加 载 地址 至 
表 6.2 识别 指令 r0， 并 跳 转 至 
该 地 址 执行 
平 台 阅 值 
ARM v5te 200 设置 路 径 请 求 
ARM v5te-vfp 200 标志 位 
ARM v7-a 40 
初始 化 路 径 
ARM v7-a-neon 40 构造 环境 
x86 200 


6.4 ”指令 到 达 阅 值 后 的 处 理 
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其 中 涉及 的 主要 代码 如 代码 清单 6.4 所 示 。 
代码 清单 6.4 dalvik/vm/mterp/out/InterpAsm-armv7-a-neon.S 


/* 达到 阔 值 ,将 计数 器 重新 置 位 * / 
ldr rl,[rSETF,#offFIhread jitThreshold] 
strb rl,[r0,r3,1sr # (32 -JIT PROF SIZE IOG 2)] @ reset counter 
EXPORT PC() 

/* 调用 函数 ,根据 pc 值 ,获取 二 进 制 代码 所 在 内 存 地 址 ,r0.t1li 存 储 函 数 参 数 * / 
mv r0,rEC 
mv rl,rSEIF 


bl dumJitGetTracemqdirThread @ (pc,self) 
/* 存储 内 存 地 址 ,inJitcodecache 是 线程 中 的 一 个 指针 类 型 woid * ), 如 果 其 为 NOLL, 则 现在 是 解释 执 
行 */ 

tr r0, [rSETF,# offThread inJitCodeCache] @ set the jnJitcodeCache flag 

mv nue @ argl of translaticn may need this 

mv lr,#0 @ in case target is HANDIER_INTERPRET 
/* 判断 内 存 地 址 是 否 是 0 * */ 
arm r0,#0 

moveq r2,# KJitTselectRequest @ 如 果 不 是 0, 则 发 送 构 造 路 径 请 求 

beq 。 ”common selectTraceJIT @ 跳 转 执行 路 径 选择 


@ 跳 转 到 路 径 选 择 后 ,主要 需要 初始 化 一 些 变量 ,代码 如 下 
camon selectTrace: 


/* 这 里 需要 调用 dumJitcheckrracsRecquest 函数 (Cc 语言 编写 ) 进 行 环境 的 初始 化 ， 
* 初始 化 之 后 ,就 直接 进入 了 单 步 构造 路 径 模 式 了 。 因 此 在 初始 化 之 前 ,需要 保存 
* 当前 的 一 些 环境 (主要 是 pc 和 印 指针 ) 


WB 
EXPORT PC() 
SAVE FC FP TO SETF() @ copy of pc/fp to Thread 


bl dumJitcheckTracsRecuest 


初始 化 之 后 ,解释 器 继续 解释 指令 .不同 的 是 ,在 解释 每 条 指令 之 前 ,都 会 调用 
dvmCheckBefore 进行 指令 检查 ,判断 是 否 要 加 入 编译 队列 中 。 比 如 对 于 MOV 指令 ,其 执 
行 代码 如 代码 清单 6.5 所 示 。 


代码 清单 6.5 dalvik/vm/mterp/out/InterpAsm-armv7-a-neon. S 


:L ALT OP MWE: /* OKOL */ 


mv r0,rEC Q@arg0 
mv rl,rFP @argl 
mv I2, rSELE Q@arg2 
b dumcheckBefore @ (GPC,dFP, self) tail call 


dvmCheckBefore 函数 的 函数 体 非 常 大 ,除了 处 理 JIT 筛选 路 径 外 ,还 需要 处 理 调试 等 
其 他 信息 。 该 函数 当 遇 到 下 述 几 种 情况 时 ,Trace 建立 就 结束 了 。 
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(1) 如 果 Trace 中 的 指令 数 不 为 0, 且 当 前 指令 是 SWITCH 指令 , 则 结束 该 Trace; 

(2) 如 果 不 是 GOTO 指令 ,上 且 是 Branch、Switch、Return、Invoke 指令 , 则 结束 该 Trace; 

(3) 如 果 抛 出 异常 (THROW) 指 令 或 者 是 个 自身 循环 指令 , 则 结束 该 Trace; 

(4) Trace 中 的 指令 数 超出 限制 ,结束 (每 个 Trace100 条 指令 ); 

(5) 如 果 是 Return 指令 ,返回 非 空 ,结束 。 

至 此 ,Trace 的 筛选 也 就 结束 了 。 

编译 线程 所 做 的 工作 是 不 断 扫描 队列 ,查看 编译 队列 中 是 否 有 未 编译 Trace。 如 果 队 
列 非 空 ,取出 队列 中 首 条 Trace 并 调用 dvmCompilerDoWork 函数 编译 之 。 编 译 生 成 的 
Native Code 需要 安装 在 Translation Cache 中 。 这 部 分 工作 由 compilerThreadStart 函数 完 
成 。 代 码 如 代码 清单 6. 6 所 示 。 

代码 清单 6.6 dalvik/vm/compiler/Compiler. cpp:compilerThreadStart() 


while (!gDumJit.haltcompilerThread) { 
Ax 首 先 需 要 判断 待 编译 队列 中 是 否 有 未 编译 Trace* / 
if workoueueIength (0)==0) { 
int ce; 
cc= pthread cond signal (kgDvmit.compijileroueueFmpty) 7 
assert (cc==0)7 
px 如果 没 有 就 等 待 * / 
pthread cond wait (kgpwmJit.oorpileroueuepctivity, 
&gpvmJit.compilerLock); 
continue; 
} else { 
db { 
Ax 从 队列 中 取出 元 素 * / 
Carpi lerWorkOrder work= workDequeue (); 
dunDnlockMatex(&ggDvmJit.compilerLock) ; 


if (gpJit.haltConmpilerThread) { 
IOD ("Carpiler shutdcown in progress - discarding request"); 
} else if (!gDyJit.codeCacheFull1) { 
jmp_ buf jnpeuf; 
work.bailPtr= gjnpBeuf; 
bool aborted setjnp (jrpBuf); 
if (!aborted) { 
/x 编译 Tracex / 
bool codecompiledF dmConpi lerDoWork (gwork) ; 
sx 设置 跳 转 地 址 * / 
dmiLockMntex (ggDymJit .ompi lerTock) ; 
if ((work.result.caheVersior== 
gpmvJit.cacheVersion) && 
CodeCanpiled && 
!work.result .discardResult && 
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work.result .codeAddress) { 
dmJitSetCodencdr (work.pc, work.result .codencdress, 
work.result..instructionset, 
false,/* not method entry * / 
work.result .profileCodeSize); 
3 
GInlockMitex (ggDvmJit .conpi lerTock); 
} 
Ax 重 置 分 配 的 内 存 * / 
dmCarpi lerArenaReset (); 
} 
free (work.info); 
dmLockMutex(kggDumJit.aompilerrocl ; 
} while (workoueuerength() (=0); 


} 


Dalvik VM 执行 Native Code 时 ,解释 器 设置 标志 位 ,解释 器 线程 将 挂 起 。 最 后 ,二 进 
制 代码 执行 结束 后 , 跳 回 解释 器 继续 解释 。 

Translation Cache 是 内 存 中 开辟 出 专门 用 来 存放 编译 Trace 后 得 到 的 机 器 码 , 对 应 于 
gDvmjJit 中 的 codeCache。Dalvik VM 同时 维护 了 另 一 张 以 PC 值 作 索引 的 Hash 表 
pJitEntryTable, 存 储 了 对 应 Trace 的 编译 后 的 信息 (包括 在 内 存 中 的 存储 位 置 ) 。 

从 Native Code 跳 回 解释 器 时 ,需要 恢复 解释 器 环境 ,包括 : DPC; @FP; 四 线程 基 指 
针 ; @ 解 释 器 标志 位 。 并 且 包 含 6 种 跳 回 模式 ,如 表 6. 3 所 示 。 

表 6.3 Native Code 跳 回 解释 器 模式 


名 称 特 点 
如 果 Dalvik 中 的 PC 指针 有 对 应 的 已 编译 的 Trace, 则 将 该 Trace 和 


二 原 Trace 连接 并 跳 到 该 Trace 执行 ,否则 , 跳 转 到 该 pc, 解释 执行 
vmJitToInterpNoChain 和 Normal 类 似 , 只 是 没有 连接 

dvmJitToInterpPunt 跳 转 到 Fast 解释 器 解释 指令 ,直到 返回 编译 代码 ,处理 异 常 所 用 

dvmJitToInterpSingleStep 使 用 Portable 解 释 器 解释 下 一 条 指令 ,解释 完 后 回 到 Native Code。 
用 于 处 理 单 步 调试 

dvmJitToInterpTraceSelect a Noral 类 似 ,不 同 在 于 Dalvik 中 PC 指针 对 应 的 路 径 不 存在 , 则 
申请 构造 路 径 

dvmjJitToInterpBackwardBranch | 为 SELF_VARIFICATION 特制 , PC 在 自身 Trace 中 


6.4 前 端 功 能 及 原理 分 析 


Dalvik JIT 前 端 主要 包 筛 选 Trace、 构 造 基本 块 .确定 控制 流 关 系 以 及 数据 流 分 析 及 优 
化 这 4 个 部 分 。 前 端的 输入 是 Dalvik 字 节 码 ,输出 是 SSA 形式 的 由 基本 块 组 成 的 控制 流 
图 。 流 程 如 图 6. 5 所 示 。 本 节 就 以 这 4 个 部 分 来 介绍 Dalvik JIT 前 端 。Dalvik JIT 对 循环 
做 了 专门 的 优化 ,在 后 两 个 部 分 和 不 包含 循环 的 处 理 有 所 不 同 ,比如 虽然 都 有 SSA 的 转换 ， 
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但 是 不 包含 循环 的 Trace 缺少 一 些 优 化 等 。 对 于 不 包含 循环 的 Trace, 编 译 入 口 为 dalvik/ 
compiler/Frontend. cpp 中 的 dvmCompilerTrace ,而 针对 循环 .入口 则 为 commonLoop。 本 
节 主 要 以 一 个 循环 为 例 贯穿 Dalvik JIT 前 端 过 程 。 


Dalvik 优化 后 
之 好 硬 和 | 3 JCFG 
字 节 码 入选 Tace Trace 构造 基本 块 BB 光 定 抱 仙 号 CFG 下 可 这 分 析 的 


图 6.5 Dalvik JIT 前 端 流 程 


循环 代码 转换 为 字 节 码 后 如 代码 清单 6.7 所 示 。 
代码 清单 6.7 ”循环 代码 转换 为 字 节 码 后 的 代码 


0000: const/4 v0,# int 0 //#0 
0001: move v1,vO 

0002: const/16 v2,# int 1000 // #3e8 
0004: if- ge vl,v2,000a // + 0006 


0006: add- int/2acdr vO,v1 

0007: aod- int/lit8 vivl,#int 1 //#0L 
0009: goto 0002 // -0007 
000a: retum- void 


6.4.1 构造 基本 块 


编译 线程 在 Dalvik VM 启动 后 启动 ,之 后 会 不 断 检测 到 编译 队列 中 是 否 有 待 编译 的 
Trace。 检 测 到 编译 队列 有 待 编译 的 Trace 后 ,开始 编译 的 第 一 步 , 构 造 基 本 块 (Basic 
Block,BB)。 基 本 块 是 一 个 只 能 从 它 的 第 一 条 指令 进入 ,并 从 最 后 一 条 指令 离开 的 最 长 的 
指令 序列 。 因 此 ,其 第 一 条 指令 只 能 是 这 三 种 情况 : 四 例 程 的 入 口 点 ; @ 分 支 的 目标 ; @ 直 
接 紧 跟 在 分 支 指 令 或 跳 转 指令 之 后 的 指令 。 

构造 基本 块 主要 分 为 两 部 分 .第 一 部 分 为 Dalvik JIT 在 构造 路 径 时 候 按 照 基本 块 原则 
将 Trace 划分 为 多 个 TraceRun。dvmCheckJit 如 代码 清单 6. 8 所 示 。 

代码 清单 6.8 dalvik/vm/interp/Jit. cpp:dvmCheckJit() 


tx 当前 执行 的 指令 已 经 不 是 顺序 执行 了 * / 

if (lastEFC != self > currRmHead + self— > CurrRunren) { 
int currTracsRumy 
/* 全 need to start a new trace rm */ 
CurrTraceRun=++ Self— > CurrTraosRin; 
Self- > currRimLere 0; 
Self- > currRmHead= (2* )lastPC; 
self— >trace[currTraceRm] .info.frag.startoffset= offset; 
self— > trace[currTraceRin] .info.frag.nmmInsts= 0; 
self— >trace[currTraceRm] .info.frag.runEnd false; 
self— > trace[currTraceRin] .info.frag.hint= kJitHintNone; 
self— >trace[currTraceRumn] .isCode= true; 
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self— > trace[self— > ourrTraceRim] .info.frag.mmmsts+ +; 
Self— >totalTracelent+ +; 
Self— > currRimIen += len; 


剩余 的 部 分 则 由 编译 线程 完成 ,其 主要 工作 是 : 

(1) 遍历 Trace 中 指令 ; 

(2) 转换 Dalvik 字 节 码 为 MIR; 

(3) 将 MIR 添加 到 基本 块 中 ,并 判断 是 否 是 跳 转 指令 ,如 果 是 ,新 建 基本 块 , 并 标记 为 
当前 正 使 用 基本 块 ,否则 继续 执行 ; 

(4) 在 跳 转 指令 后 添加 Chaining Cell。 此 时 该 类 型 基本 块 中 没有 任何 代码 。 

这 部 分 的 代码 在 dvmCompilerTrace 函数 中 ,如 代码 清单 6.9 所 示 。 

代码 清单 6.9 dalvik/vm/compiler/Frontend. cpp:dvmCompilerTrace() 


while (1) { 
MIR * insn; 
int width; 
insr= MIR * )dwrCarpilerNew (sizeof MIR) ,true); 
insn- > offset= curoffset; 
Ax 解 析 并 分 解 指令 ,设置 MR 中 相应 元 素 * / 
width= parseInsn (codePtr,&insn- > dalvikInsn, cnit .printMe); 


assert (width) ; 
insn- > width= width; 
tracesize+ =width; 
ix 将 MR 加 入 到 基本 块 中 ,cureB 为 当前 正在 使 用 基本 块 * / 
dcorpilermppendMIR (CurEB,insn)7 
cUnit.numiInsts++ 7 
sx 获取 指令 类 型 * / 
int flags= dexGetF1agsFronopcode (insn- > dalvikInsn.opoode); 
Ax 指 令 是 调用 指令 时 的 处 理 * / 
if (flags & kInstrInvoke) { 
const Method * calleeMethod= (const Method * ) 
CUrrRM[JIT TRACE COUR METHOD] .info.meta; 
assert (numInsts== 1); 
CallsiteInfo * callsiteInfo= 
(CallsiteInfo * )dnCarpilerNew (sizeof (CallsiteInfo) ,true); 
callsiteInfo- > classDescriptor= (coonst char * ) 
CurrRum[UTT TRACE CIASS TESC] .info.meta; 
callsiteInfo- > classLoader= (Object * ) 
CurrRun[JTT TRACE CIASS IOATER] .info.meta; 
CallsiteInfo- >method= callesMethod7 
insn— >meta.callsiteInfo= callsiteInfo; 


/x 指令 数 超过 临界 值 了 x / 
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if (cUnit.numInsts >=nnMaxInsts) { 


} 


break; 


Axx 在 当前 TraceRm 中 ,已 经 是 最 后 一 条 指令 x / 
if (-nmInsts==0) { 


if (currRm- > info.frag.runEnd) { 


break; 


} else { 


sx 寻找 包含 代码 的 TraceRm * / 
Go { 

CurrRuntr+ 7 
} while (!currRuan- > iscCode); 


/* Dummy end- of- rn marker seen * / 
if (currRun- > info.frag.nmInsts==0) { 
break; 
} 
A* 新 建 一 个 基本 块 * / 
CUrBB= dvmCorpilerNewBB (kDalvikByteCode, nnBlocks+ + ); 
dmInsertGrowableList (blockList, (intptr t) curBB); 
curoffset= currRm- > info.frag.startoffset; 
numInsts= orrRm- > info.frag.nmInsts; 
CurBB- > startoffset= curoffset; 
codePtr= dexCode- > insns+ curOffset; 


可 以 看 到 ,编译 线程 主要 的 工作 就 是 调用 parseInsn 函数 将 字 节 码 转 换 为 MIR。MIR 
全 称 为 中 级 中 间 表 示 。MIR 是 拆 解 了 的 Dalvik 字 节 码 ,在 形式 上 接近 Dalvik 字 节 码 ,为 便 
于 后 期 的 方便 操作 。 其 包含 Dalvik 字 节 码 , 并 包括 字 节 码 的 一 些 其 他 属性 ,比如 字 节 码 长 
度 (width)。 其 结构 体 定义 如 代码 清单 6. 10 所 示 。 

代码 清单 6.10 dalvik/vm/compiler/CompilerIR. h: MIR 


typedef struct MIR { 
DecodedInstruction dalvikInsn; ””// 操 作 码 


unsigned int wigth; // 指 令 长 度 
unsigned int offset; // 指 令 位 置 
struct MIR * prev; // 前 一 条 MIR 指 令 
struct MIR * next; // 后 一 条 MIR 指 令 


} MR; 
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除去 Trace 本 身 划 分 的 基本 块 之 外 ,每 一 个 Trace 都 还 对 应 了 一 些 额 外 的 基本 块 ,有 如 
下 几 类 : Entry Block(Trace 的 人口)、Exit Block(Trace 的 出 口 )、Backward Branch Block、 
PC Reconstruction Block .Exception Handling Block。Backward Branch Block 是 因为 循环 
新 加 的 。 

点 拨 ”其实 MIR 并 没有 多 少 特殊 ,只 是 字 节 码 分 解 后 的 产物 。 其 实 和 普通 指令 拆 解 出 
操作 码 、 操 作 数 、 指 令 长 等 信息 在 原理 上 是 一 样 的 。 字 节 码 .MIR 以 及 后 文 所 说 的 LIR 都 是 
中 间 代 码 。 

当 Trace 被 确定 可 能 包含 循环 后 ,Dalvik JIT 将 会 有 专门 的 处 理 和 优化 ,基本 块 的 构造 
过 程 和 前 述 略 有 不 同 。 循 环 的 基本 块 是 递归 构造 的 .如 果 Trace 是 租 套 循环 的 一 部 分 ,将 会 
扫描 出 整个 柑 套 循环 ,还 包括 不 在 预先 构建 的 Trace 中 的 内 容 。 同 时 ,针对 循环 划分 出 的 基 
本 块 其 顺序 安排 也 略 有 不 同 。Exit Block 是 安排 在 Entry Block 之 后 ,而 不 是 在 最 后 。 这 部 
分 内 容 由 dalvik/vm/compiler/exhaustTrace 函数 完成 。 

点 拨 Dalvik JIT 单独 对 包含 循环 的 Trace 进行 处 理 , 入 口 为 dalvik/vm/compiler/ 
Frontend. cpp/compileLoop 函数 中 。 需 要 注意 的 是 dvmCompilerTrace 跳 转 入 这 个 函数 
前 ,需要 释放 编译 Trace 时 分 配 的 资源 。 因 为 对 于 循环 ,前面 构造 处 的 Trace 并 不 完整 。 

本 节 开 头 处 的 字 节 码 将 至 少 被 识别 出 一 条 Trace, 该 Trace 包含 循环 。 基 本 块 构造 后 ， 
将 会 有 两 个 代码 块 ,分 别 包括 指令 0006、0007、0009 三 条 指令 和 0002、0004 两 条 指令 。 


6.4.2 确定 控制 流 关系 


分 解 完 Trace 并 构建 好 基本 块 后 ,需要 扫描 基本 块 ,确定 基本 块 之 间 的 连接 关系 ,也 就 
是 Trace 的 控制 流 关系 。 

在 编译 器 中 ,控制 流 图 G 二 (N,EE) 定 义 如 下 : 

(1) 包含 节点 集 N; 

(2) 包含 边 集 EENXN。 通 常 ,将 边 写成 w->0, 而 不 是 <a,p 之 。 如 果 边 zyEE, 表 
示 工 节点 执行 完 后 可 以 马上 执行 y 节点 ; 

(3) 包含 一 个 人 口 节点 Entry 和 一 个 出 口 节 点 Exit, 其 中 EntrE N,ExitE N。 

和 Dalvik JIT 相对 应 ,基本 块 即 是 这 里 的 节点 ,基本 块 之 间 的 联系 则 对 应 了 边 集 。 一 般 
情况 下 ,Dalvik JIT 需要 扫描 每 一 个 基本 块 , 并 分 析 每 一 个 基本 块 的 最 后 一 条 指令 。 根 据 指 
令 跳 转 地 址 ,插入 基本 块 或 连接 基本 块 。Dalvik JIT 中 每 一 个 基本 块 都 有 taken 和 
fallthrough 指针 ,指向 要 跳 转 的 基本 块 。 

如 果 基 本 块 的 跳 转 地 址 小 于 当前 指令 的 地 址 ,初步 认为 其 是 可 以 优化 的 循环 , Dalvik 
JIT 会 对 其 进行 专门 的 处 理 。Android 4. 0.4 版 本 中 的 Dalvik JIT 在 开始 处 理 循环 时 ,会 销 
筑 开 始 已 经 分 配 的 内 存 ( 如 基本 块 ) ,并重 置 已 经 设置 过 的 变量 (如 基本 块 个 数 )。 确 定 包含 
循环 的 Trace 的 控制 流 图 是 和 构造 Trace 基本 块 融合 在 一 起 的 。 在 递归 地 构造 基本 块 的 同 
时 ,会 连接 各 个 基本 块 。 

代码 清单 6. 11 dalvik/vm/compiler/Frontend. cpp:dvmCompileTrace#() 

for (plockId= 0; blockId< blockList— > nnUsed; blockId+ + ) { 

curBB= (BasicBlock * ) dGrowableListGetElement (blockList,blockId) ; 
MIR * lastInsrr curBB- > lastMIRInsn; 
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Asx 略 过 空 块 关 / 
if (lastInsr==NULL) { 
continue; 
} 
/x 计算 fallthrough 和 target 地址 ,target 地 址 为 最 后 一 条 指令 跳 转 的 地 址 ， 
* 相应 的 fallthrough 为 顺序 存储 指令 的 下 一 条 指令 * / 
Curoffset= lastInsn- > offset; 
Wsigned int targetoffset= curoffset; 
unsigned int fallThroughoffset= curoffset + lastInsn- > width; 
bool isInvoke= false; 
Const Method * callee= NULL; 


fingBlockBoundary (Gesc- >method,curBB- > lastMIRINsn, curOffset, 
&targetOffset, &isInvoke, &callee); 


/* Link the taken and fallthrough blocks * / 
BasicBlock * searchEB; 


int flags= dexGetFlagsFranOpoode (lastInsn- > dalvikImnsn.apoode); 
A* 记 录 invoke 指 令 ,后续 处 理 有 用 * / 
if (flags & kInstrInvoke) { 

Unit .hasInvoke= true; 


Ax 如 果 跳 转 指令 跳 转 的 地 址 小 于 当前 指令 的 地 址 , 则 可 能 包含 循环 ,进行 专门 
* 的 处 理 , 在 这 之 前 ,需要 注意 的 是 需要 释放 资源 * / 
if (isInvoke== false && 
(flags & kInstrCanBranch) !=0 && 
targetoffset< curOffset && 
(aptHints & JIT OPT NO IOOP)==0) { 
GmCorpi lerArenaReset (); 
retum carpilerocp (scUnit, startOffset,desc,nurMaxTInsts, 
info,bailPtr, optHints); 


/* 遍历 所 有 的 基本 块 ,比较 target 和 fallthrough 与 基本 块 首 条 指令 的 偏 移 地 址 * / 
Size 七 searchBlockId; 
for (searchBlockId= blockrdr 1; searchBlockIG< blockList— > mmUsed; 
searchBlockId+ +) { 
SearchEB= (BasicBlock * ) dmGrowableListGetElement (olockList, 
SearchBlockId) 
if (targetoffset== searchEB- > startOffset) { 
CurBB- > takere SearchEB7 
dumcompilersetBit (searchBB- > predecessors,curEB- > id); 
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if (fallThroughoffset== searchEB- > startOffset) { 
CUPEB- > fl11ThroughF seardPB; 
dumcompilerSetBit (searchBB- > predecessors,curEB- > id); 
As* 函数 调用 指令 需要 对 齐 处 理 * / 
证 (flags & kInstrInvoke) { 
searchBB- > jsFallThroughFromInvoke= true; 


} 
} 
sx 基本 块 中 有 些 指 令 没 有 改变 控制 流 , 比 如 fallthrough,target 跳 转 地 址 不 
* 在 Trace 中 、switch 指 令 等 ,这 些 有 不 同 的 处 理 ,篇 幅 原 因 ,就 省 略 部 分 代码 * / 
CurBB- > needFallThroughBranGr 
((flags & (kInstrCcanBranch | kInstrCanSwitch | kInstrcanRetum | 
kInstrInvoke))== 0); 
if (lastInsn- > dalvikInsn.opoode==OP PACKED SWITCH || 
lastInsn- > dalvikInsn.dpoode==OP SPARSE SWTTCH) { 


/* fallthrough 跳 转 的 地 址 不 在 Trace 中 ,此 时 需要 跳 回 解释 器 * / 
} else if (!isUnconditionalBranch(lastInsn) && 
curBB- > fallThrough= =NOULL) { 


} 
/* target 跳 转 地 址 不 在 Trace 中 */ 
if (CurEB- > taken==NULL && 
(isGoto(lastInsn) | | isInvoke 11 
(targetoffset !=UNKNOWN _ TARGET && targetOffset != CurOffset))) { 


} else {Ax* 最 后 对 那些 非 条 件 跳 转 的 指令 进行 处 理 * / 


} 

if (newEB) {x 新 建 一 个 BB* / 
CurBB- > takere newBB; 
dmcCompijlersetBit (newEB- > Predecessors,curEB- > id); 
dmInsertGrowableList (blockList, (intptr t) newEB) 7 


’ 


对 于 本 节 开 头 的 例子 ,将 得 到 如 图 6.6 所 示 的 内 存 安排 位 置 图 以 及 如 图 6.7 所 示 的 基 
本 块 控 制 流 图 。 为 描述 简便 ,图 6.7 经 过 简化 后 变 为 图 6.8。 


6.4.3 ”识别 及 筛选 循环 

编译 器 在 优化 处 理 方面 经 过 几 十 年 的 发 展 ,已 经 形成 了 一 套 理论 ,而 在 Dalvik JIT 中 的 
很 多 优化 实现 都 是 基于 前 人 的 理论 基础 。 因 此 ,首先 不 得 不 引入 一 些 枯燥 的 理论 知识 ,解释 
在 这 个 过 程 中 涉及 的 一 些 基本 概念 。 
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Entry 
Exit 
Cod 
le 
Block (Enty ) 
Code2 1 
Code Block1 六 
Normal 
Backward Code Block 2 
Chaing 1 
# Cell 
PC Restruction Normal Chaining (4) 
Exception 
Handling () 
图 6.6 基本 块 内 存 位 置 图 图 6.7 基本 块 控制 流 图 图 6.8 控制 流 简化 图 


必 经 节点 (Dominator): 如 果 从 Entry 节点 到 节点 i 的 每 一 条 可 能 的 执行 路 径 都 包含 
qd 节点, 则 说 节点 d 是 节点 i 的 必 经 节点 , 记 作 d dom i。 根 据 定义 可 以 看 到 dom 是 自 反 的 、 
传递 的 以 及 反对 称 的 。 记 i 的 必 经 节点 集合 是 dom (i)。 

严格 必 经 节点 (Strict Dominator): 如 果 a dom b 有 是 a 关 b, 那 么 称 a 是 0 的 严格 必 经 节 
点 , 记 作 a sdom 5。 记 4 的 严格 必 经 节点 是 sdom (0) 。 

直接 必 经 节点 (Immediate Dominator): 对 于 a 关 b,a idom b 当 且 仅 当 a dom b 上 且 不 存 
在 一 个 < 天 au 并 且 c 天 0 的 节点 c<, 使 得 a dom c 且 c dom 6。 记 5 的 直接 必 经 节点 为 idom 


(5b)。 直 观 上 ,直接 必 经 节点 是 距离 b 最 近 的 必 经 节点 。 同 时 ,节点 的 直接 必 经 节点 是 唯 
一 的 。 
回 边 (Back edge) : 如 果 边 a>b 是 回 边 , 则 其 头 45 是 尾 a 的 必 经 节点 。 


在 大 多 数 语言 中 ,循环 有 多 种 描述 方法 。 以 C 语言 为 例 ,其 中 可 以 由 for 循环 、while 循 
环 甚至 可 以 用 goto 语句 和 标号 来 定义 。 但 是 从 程序 分 析 的 角度 看 ,在 源码 中 循环 的 描述 方 
式 并 不 重要 ,重要 的 是 这 些 循环 是 否 可 以 被 优化 。 自 然 循环 (nation loop) 就 是 一 种 可 以 优 
化 的 循环 ,其 定义 如 下 。 

(1) 必须 具有 一 个 唯一 的 和 人口 节点 (Entry) , 称 为 循环 头 。 该 节点 支配 了 循环 中 的 所 有 

(2) 必然 存在 一 条 进入 循环 头 的 回 边 ,否则 就 不 存在 循环 。 

已 知 一 条 回 边 a->b 的 自然 循环 由 满足 如 下 条 件 的 节点 集合 和 边 集 合 组 成 : 节点 集合 
由 节点 5 以 及 流 图 中 那些 不 经 过 4 可 以 到 达 a 的 所 有 节点 组 成 , 边 集 合 由 节点 集合 众 连接 
节点 的 边 组 成 。 同 时 可 知 , 节 点 2 是 自然 循环 的 循环 头 , 只 有 循环 头 是 相同 的 ,两 个 循环 才 
可 能 一 样 。 

Dalvik JIT 在 筛选 的 循环 首先 必须 满足 自然 循环 这 个 条 件 , 其 次 只 筛选 出 一 条 回 边 的 
自然 循环 。 正 如 前 文 所 说 ,如 果 循 环 是 嵌 套 的 ,在 构造 基本 块 和 确定 控制 流 关 系 时 ,将 得 到 
包含 其 中 的 所 有 循环 。Dalvik JIT 利用 必 经 节点 (Dominator) 来 标识 和 筛选 出 Trace 中 的 
自然 循环 。 这 一 部 分 的 工作 主要 由 函数 dvmCompilerBuildLoop 完成 。 
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基于 以 上 概念 , Dalvik JIT 首先 对 整个 控制 流 图 进行 深度 优先 排序 (depth-first 
ordering) (函数 computeDFSOrder) 。 在 深度 优先 排序 中 ,首先 访问 一 个 节点 ,然后 递归 所 
历 该 节点 的 右 子 节点 ,再 递归 遍历 该 节点 的 左 子 节点 。 以 图 6. 7 为 例 ,深度 优先 排序 的 顺序 
为 {0,2,3,4,1}。 按 照 深度 优先 排序 后 的 节点 顺序 计算 节点 间 的 dominance 关系 ,每 个 节点 
的 必 经 节点 为 : 

D(0)={0} 

D(2)={2}UD(2)= {0,2} 

D3)={3}UD(2)= {0,3} 

D(4)={0,2,3,4} 

D(1)={0,1,2,3,4} 


每 个 节点 的 直接 必 经 节点 为 : 

idom (0) 一 下 

i dom (2)={0} 

i dom (3)={2} 

i dom (4)= {3} 

i dom (1)={4} 

由 函数 compute| Dominators 确定 节点 间 的 dominance 关系 后 ,需要 筛选 出 Trace 中 包 
含 的 循环 。Dalvik JIT 默认 循环 头 必 须 在 和 人口 节点 指向 的 第 一 个 节点 ,并 且 循 环 头 至 少 需 


要 前 驱 节 点 。 之 后 ,根据 计算 好 的 dominance 关系 ,判断 Trace 中 是 否 有 回 边 。 比 如 对 于 上 
述 例子 , 边 3 一 2 就 是 该 循环 的 回 边 。 由 于 该 例 是 个 单 重 循环 ,经 过 筛选 后 ,所 得 到 的 控制 流 
图 和 图 6. 7 是 一 样 的 。 

涉及 的 代码 在 dalvik/vm/compiler/SSATransformation. cpp 中 。CompileLoop 函数 调 
用 dvmCompilerBuildLoop 函数 进行 识别 和 优化 循环 。 代 码 如 代码 清单 6. 12 所 示 。 

代码 清单 6. 12 dalvik/vm/ compiler/SSATransformation . cpp: dvmCompilerBuildLoop() 


bool dnCanpilerBuildIop (CompilationUnit * cnit) 
{ 
/* 计算 深度 优先 排序 * / 
CorputeDFSOrder (CUnit) 7 
/* 计算 必 经 节点 信息 * / 
canputeDcminators (cUnit); 


if (gDvit.norilterIoop== false) { 
if£ (dmConpilerFilterToopBlocks (cUnit)== false) 
retum false; 
/* 重新 计算 深度 优先 排序 * / 
computeDFESOrder (cUnit); 
/* 重新 计算 必 经 节点 信息 * / 
corputeDominators (cUnit); 
} 
/* 接 下 来 一 部 分 是 进行 SR 转换 * / 
dmInitializessAConversion (cUnit); 
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/* 计算 define 和 use 属性 的 寄存 器 * / 
conputeDefBlockMatrix (cUnit); 
/< 搬入 Fi 节点 x*/ 
insertFhiNodes (cUnit); 
/* SSA 转 换 * / 
dmCanpi lerpataFlownalysisDi spat dher (onit, dmCarpi lerpossAConversion, 
kPreorderDFSTraversal, false /* isIterative * /); 
Asx# 记录 已 经 分 配 的 寄存 器 * / 
cUnit- > tempSSRRegister dCorpi lerAllocBitVector (cnit— > numSSRRegs， 
false); 
/x* 插入 Ehi 节 点 的 参数 * / 
dmCapi lerpataFlowAnalysisDi spat cher (GUnit,insertEhiNodeoperandsy 
kKReachableNodes, 
false /* isIterative * /); 
A*# 打 印 控制 流 图 * / 
if (gpDwmJit.receivedsIGUSR2 || gpwmJit.printMe) { 
GumDurpCFG (cnit, "/sdcard/cfg/"); 
} 
retum true; 
} 


以 上 代码 中 包括 6. 4.4 节 中 介绍 的 SSA 形式 转换 。 不 论 Trace 中 是 否 包含 循环 ,都 要 
进行 SSA 转换 ,其 中 涉及 的 原理 是 一 样 的 。 

点 拨 ”读者 可 能 已 经 注意 到 ,在 上 面 的 代码 中 会 在 /sdcard/cfg/ 目 录 下 有 一 些 动作 。 
不 错 ,这 部 分 代码 用 来 输出 当前 已 经 构造 完成 的 控制 流 图 ,是 笔者 在 阅读 源码 过 程 中 加 上 
的 。 在 阅读 源码 的 过 程 中 ,输出 当前 的 执行 状态 ,对 阅读 源码 有 十 分 大 的 帮助 。 其 使 用 方法 
是 在 运行 dex 或 zip 文件 时 ,加 上 -Xjitverbose 参数 。 完 成 后 ,将 在 /sdcard/cfg/ 目 录 下 生成 
dot 图 。 用 dot 工具 转换 后 就 可 以 直观 看 到 控制 流 图 了 。 注 意 ,/sdcard/ 下 没有 cfg 目录 , 需 
要 手动 建立 。 


6.4.4 SSA 形式 转换 


静态 单 赋值 是 一 种 高 效 的 数据 流 分 析 技 术 。 如 果 在 某 个 过 程 内 赋值 的 每 一 个 变量 作为 
赋值 的 目标 只 出 现 一 次 , 则 说 这 个 过 程 是 静态 单 赋 值 (Static Single Assignment,'SSA) 的 形 
式 。 作 为 一 种 中 间 表 示 ,SSA 形式 能 带 来 精确 的 使 用 -定义 关系 ,从 而 简化 了 一 些 优 化 过 程 ， 
包括 常数 传播 . 死 代 码 删除 .部 分 兄 余 消除 以 及 寄存 器 分 配 优化 等 。 现 代 编 译 器 一 般 首 先 将 
给 定 表示 转换 为 SSA 形式 ,优化 基于 SSA 形式 操作 ,最 后 将 SSA 形式 转换 成 原来 的 形式 。 

转换 为 SSA 形式 中 间 代 码 的 标准 操作 是 给 每 一 个 赋值 的 变量 带 上 一 个 下 标 
(Subscription) 。 为 区 分 分 支 指令 中 对 变量 的 多 种 赋值 操作 ,在 分 支 指 令 的 汇合 点 插入 $ 函数 ， 
如 果 程 序 是 线性 的 ,其 中 没有 循环 控制 指令 , 则 不 需要 $ 函数 。$ 函数 的 参数 个 数 为 汇合 点 出 
变量 的 版 本 个 数 ,每 个 参数 (版 本 ) 和 汇合 点 的 特定 控制 流 前 驱 对 应 。 如 图 6. 9 所 示 经 过 转换 
后 变 成 图 6. 10。 经 过 变换 后 ,和 变量 x 等 同 的 有 {xi ,xz), 同 理 变量 w、y、z 也 类 似 。 但 是 在 汇 
合 点 处 ,无 法 确定 y 到 底 使 用 哪 一 个 值 , 因 为 不 论 是 左 侧 分 支 还 是 右 侧 分 支 , 都 对 变量 y 进行 
了 定义 。 此 时 插入 了 $ 函数 ,其 参数 是 y, 和 y, .返回 为 变量 y 的 新 版 本 ys。 
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| X15 
Xd 一 5 Xoe 一 Xi-3 
XK-—3 x2<37 


yx*2 ee Wieyi yc 一 x2-3 
三 ~_/ 
、\ / y3 一 0(yiy2) 
Wy WX 3 
Zext+y ZI 人 一 X2+y3 
图 6.9 原 控制 流 图 图 6.10 原 控制 流 图 


从 普通 的 中 间 表 示 转 换 到 SSA 形式 时 需要 以 下 两 个 步骤 : 四 寻找 汇合 点 ,插入 简单 的 
函数 (函数 insertPhiNodes); 加 变量 重 命名 (函数 dvmCompilerDoSSAConversion) 。 在 
Dalvik JIT 中 ,这 两 部 分 的 工作 都 在 dalvik/vm/compiler/SSATRansformation. cpp 中 。 寻 
找 汇合 点 ,插入 函数 一 般 借助 支配 边界 来 实现 。 在 插入 函数 后 ,就 开始 进行 变量 重 
命名 。 

SSA 对 寄存 器 的 使 用 分 为 两 种 ,分 别 是 Uses( 使 用 ) 和 Define( 定 义 )。Uses 表示 只 是 
对 寄存 器 的 使 用 ,并 没有 更 改 寄 存 器 中 的 值 。Define 表示 重新 设置 了 寄存 器 中 的 值 , 下 次 再 
引用 该 寄存 器 会 使 用 新 的 值 。Dalvik 字 节 码 对 所 有 的 字 节 码 进行 了 分 类 ,部 分 属性 如 
表 6.4 所 示 。 每 一 个 字 节 码 都 有 相应 的 属性 。 


表 6.4 数据 流 分 析 指 令 属性 


属 性 人 告 六 属 性 含 
kUA Uses,vA kDAWide Define, vA wide 
kUB Uses,vB kIsMove Move 指令 
kUC Uses,vC kSetsConst Const 指令 
kUAWide Uses,vA wide( 两 个 字 节 ) kFormat35c 35c 格式 指令 
kUBWide Uses,vB wide kFormat3rc 3rc 格式 指令 
kUCWide Uses,vC wide kPhi Phi 节点 
kDA Define,vA 


比如 指令 move vA, vB, 其 中 使 用 vA 寄存 器 ,并 定义 了 vB 寄存 器 ,因而 指令 包含 kUB 
和 kDA 的 属性 。$ 函数 定义 了 一 个 寄存 器 ,因而 其 包含 kDA 和 kPhi 属性 。 但 此 时 ,因为 
不 知道 其 他 寄存 器 的 SSA 表示 ,$ 函数 没有 参数 。 

在 转换 成 SSA 形式 时 ,需要 将 Dalvik Reg( 字 节 码 中 使 用 的 寄存 器 ) 一 一 映射 成 SSA 
Reg(SSA 形式 使 用 的 寄存 器 ) ;同时 ,在 SSA 形式 转换 回 Dalvik 字 节 码 时 ,SSA 形式 采用 的 
寄存 器 表示 需要 映射 回 Dalvik 寄存 器 。 为 实现 这 一 功能 ,Dalvik JIT 设计 了 两 个 数据 结构 ， 
分 别 是 一 个 数组 (Dalvik2SSAMap) 和 一 个 链表 (SSA2DalvikMap)。 

Dalvik VM 采用 的 Dex 文件 已 经 说 明了 整个 Dex 使 用 的 寄存 器 个 数 。Dalvik2SSAMap 数 
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组 的 长 度 刚好 是 寄存 器 个 数 ,存储 的 元 素 是 SSA 形式 寄存 器 。Dalvik2SSAMap 数组 元 素 为 
32 位 的 整 型 ,高 16 位 表示 下 标 , 低 16 位 为 SSA 形式 寄存 器 号 。 同 理 ,SSA2DalvikMap 中 元 素 
也 是 32 位 整 型 ,高 16 位 为 下 标 , 低 16 位 为 对 应 的 Dalvik 字 节 码 中 的 寄存 器 号 。 

JIT 遍历 代码 块 中 所 有 MIR, 如 果 包 含 使 用 寄存 器 , 则 根据 寄存 器 号 从 Dalvik2SSAMap 中 
取出 最 近 的 SSA 形式 寄存 器 ;如 果 包 含 定义 寄存 器 , 则 根据 寄存 器 号 在 Dalvik2SSAMap 中 设 
置 新 的 SSA 寄存 器 号 ,同时 ,在 SSA2DalvikMap 中 添加 新 元 素 。 

例如 ,指令 add-int/2addr v0,v0.vl 实现 了 将 v0=v0 十 vl 的 功能 ,其 SSA 转换 过 程 图 
如 图 6. 11 所 示 。 首 先 转换 有 USE 属性 的 寄存 器 ,根据 寄存 器 号 在 Dalvik2SSAMap 中 查找 
到 当前 正 使 用 的 SSA 寄存 器 ,此 时 v0 和 v1 分 别 转换 为 v5_0 和 v4_0。 之 后 ,再 转换 Define 
属性 的 寄存 器 v0 ,根据 寄存 器 号 更 改 Dalvik2SSAMap 中 SSA 寄存 器 v5_0 为 v6_0; 同 时 根 
据 SSA 寄存 器 号 6 在 SSA2DalvikMap 中 添加 对 应 的 Dalvik 寄存 器 v0_2。Dalvik 寄存 器 
v0_2 表示 使 用 v0 寄存 器 ,目前 为 第 三 个 版 本 。 其 具体 的 实现 过 程 在 dalvik/vm/compiler/ 
Dataflow. cpp 中 的 dvmCompilerDoSSAConversion 函数 中 。 


目的 寄存 器 。” 源 寄存 器 。 源 寄存 器 


SSA2DalvikMap Add-int/2addr | V0 T V0 T V1 
区 
Define USE 
, USE 
Dalvik2SSAM 
Ed 站 Dalvik2SSAMap 
V1L_1 4 0 V6 0 本 v5 0 0 
Vol1 15 1| V40 二 v40 RT 
v02 6 
Add-int2addr| V60 | Y50 | v40 


6.11 SSA 形式 转换 图 


在 SSA 转换 完成 后 ,就 可 以 进行 基于 SSA 形式 的 数据 流 分 析 。Dalvik JIT 中 包括 常量 
传播 .归纳 变量 、 宛 余 边 界 检 查 消除 等 数据 流 分 析 及 优化 技术 。 由 于 Dex 文件 是 由 Class 文 
件 经 过 dx 工具 转换 和 优化 过 后 生成 的 ,JIT 所 能 做 的 工作 并 不 是 很 多 。 


6.5 后 端 功 能 及 原理 分 析 


Dalvik JIT 后 端 主要 包括 寄存 器 分 配 、.MIR 转换 为 LIR、LIR 转换 为 机 器 码 以 及 二 进 制 
Native Code 的 安装 这 4 个 部 分 。 经 过 Dalvik JIT 前 端 处 理 后 ,此 时 的 输入 是 SSA 形式 的 
由 基本 块 组 成 的 控制 流 图 。 再 经 过 寄存 器 分 配 以 及 进一步 的 优化 转 为 机 器 码 , 最 后 安装 到 
Translation Cache 中 ,其 流程 图 如 图 6. 12 所 示 。 为 简便 叙述 ,本 节 将 分 为 MIR 转换 为 LIR 
和 LIR 转换 为 机 器 码 两 部 分 介绍 。 其 中 ,MIR 转换 为 LIR 包括 寄存 器 分 配 ;LIR 转换 为 机 
器 码 包括 二 进 制 代 码 的 安装 。 
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优化 后 | MIR 转 换 为 LIR 


的 CFG 


高 在 器 分 本 | | -| 机 器 码 。| 机 器 码 安装 


6.12 ”Dalvik JIT 后 端 流程 


6.5.1 MIR 转换 为 LIR 


经 过 前 端 处 理 后 ,此 时 的 输入 是 以 MIR 组 成 的 SSA 形式 的 控制 流 图 (CFG)。 输 出 是 
LIR 链 。 所 谓 的 LIR, 是 和 硬件 平台 相关 的 。 由 于 篇 幅 限 制 ,本 章 只 是 介绍 针对 ARM 平台 
的 后 端 过 程 。 比 如 针对 ARM 平台 的 LIR, 其 定义 如 代码 清单 6. 13 所 示 。 

代码 清单 6. 13 dalvik/vm/compiler/codegen/arm/ArmLIR. h: ArmLIR 


typedef struct AmLIR { 


LIR generic; // 通 用 LR 

AmrOpoode cpoode; /EM 指令 操作 码 

int operands[4]; // [0.3]= [dest,srcl,src2,extral 
} AmLIR; 


JIT 逐个 基本 块 逐 条 扫描 MIR 指令 ,根据 不 同 的 指令 类 型 进行 相应 的 处 理 。 每 一 个 基 
本 块 对 应 了 一 个 标签 (Label) ,标签 名 包含 基本 块 的 首 条 指令 以 保证 标签 的 唯一 性 。 

Dalvik JIT 为 每 一 类 的 字 节 码 都 设计 了 转换 函数 ,具体 的 函数 实现 在 dalvik/vm/ 
compiler/codegen/arm/CodegenDriver. cpp 中 。 字 节 码 根据 第 1 卷 第 2 章 所 述 的 字 节 码 ID 
来 分 类 ,相同 类 别 的 指令 有 相同 的 转换 函数 。 转 换 函 数 的 命名 规范 是 “handleFmt 十 指令 格 
式 ”, 比 如 对 格式 为 “11x? 的 指令 ,有 函数 如 下 : 


handleFhntl1]x (CompilationUnit * cUnit,MIR * mir); 


如 果 两 类 指令 的 处 理 过 程 类 似 , 则 在 函数 后 再 扩展 上 相应 的 格式 。 如 对 于 格式 为 
“35ms” 和 “3rms” 的 指令 ,其 处 理 过 程 类 似 , 则 有 : 


handleFtnt 35ms 3mms (CarpilationUnit * cinit, MIR * mir, BasicBlock * bb, AmLIR * labelList); 


对 于 每 一 条 指令 ,转换 函数 主要 处 理 步 又 如 下 。 

(1) 获取 源 寄存 器 数据 (如 果 有 ) 并 加 载 至 LIR 寄存 器 ; 

(2) 获取 目的 寄存 器 数据 并 加 载 至 LIR 寄存 器 ; 

(3) 根据 Dalvik 字 节 码 指 令 操 作 码 ,生成 对 应 的 LIR 指令 ; 

(4) 运算 结果 存 回 目的 寄存 器 对 应 的 内 存 地 址 。 

源 寄存 器 或 目的 寄存 器 指 的 是 Dalvik 字 节 码 中 的 寄存 器 。 在 加 载 Dalvik 寄存 器 中 的 
值 至 LIR 寄存 器 的 过 程 中 ,涉及 Dalvik JIT 转换 后 的 Native Code 和 解释 器 之 间 的 数据 交 
互 。 在 解释 器 中 , 某 几 个 寄存 器 有 特定 的 安排 ,如 表 6. 5 所 示 。 

比如 对 于 MOVE_RESULT 指令 ,就 有 如 下 代码 ,其 中 rlDest 是 目的 寄存 器 ,rlSrc 是 
源 寄 存 器 ,storeValue 将 源 寄存 器 的 值 存储 到 目的 寄存 器 中 。 
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表 6.5 ARM 解释 器 寄存 器 安排 


ARM 寄存 器 Dalvik VM 使 用 名 称 用 途 
R4 rPC 解释 器 中 使 用 的 程序 计数 器 
R5 rFP 解释 器 中 使 用 的 栈 底 指 针 
R6 rSELF Self 线程 指针 
R7 rINST 当前 指令 首 个 16b 单元 
R8 rIBASE 解释 器 中 使 用 的 指令 基地 址 ,用 以 计算 goto 地 址 


代码 清单 6. 14 dalvik/vm/ compiler/codegen/arm/ CodegenDriver. cpp:handleFmtl1x() 


Case OP MIVE RESULT: 
Case OP MOVE RESULT OBJECT: { 
/* M inlined move result is effectively no- ap */ 
if mir- >OptimizationF1ags & MIR_INUINED) 
break; 
RegLocation rlDest= dwmConpi lerGetDest (dnit,mir, 0); 
RegLocation rlsrc=IOC DAIVIK RETURN VAL; 
TlSrc.fp= rlDest.fp; 
storeValue (cUnit, rlDest, rlSrc); 
break; 
} 
字 节 码 中 所 有 要 用 到 的 寄存 器 在 解释 器 栈 上 都 有 对 应 的 存储 区 域 ,每 个 寄存 器 占用 
4B。 其 访问 方式 是 栈 底 指针 十 寄存 器 号 X4。 以 寄存 器 号 为 索引 ,比如 v5 寄存 器 ,对 应 的 
在 栈 中 的 位 置 就 是 FP 十 20。Native Code 对 数据 的 操作 最 终 会 反映 在 解释 器 栈 上 ,从 而 使 
得 Native Code 和 解释 器 之 间 可 以 平滑 过 渡 。 因 此 在 转换 过 程 中 不 论 是 获取 Dalvik 寄存 器 
值 还 是 存 回 运算 结果 ,都 需要 有 访 存 指 令 。 比 如 对 于 字 节 码 add-int/2addr v0，v1, 其 转换 
后 对 应 的 LIR 指令 应 该 如 代码 清单 6. 15 所 示 。 
代码 清单 6.15 ”转换 后 的 LIR 


ldr  r0,[r5,#0] 
ldr rl,[r5,# 
adds rr0,r0,rl 

str  r0,[r5,#0] 


从 中 可 以 看 到 ,首先 获取 了 该 操作 码 的 两 个 操作 数 ,Dalvik 寄存 器 v0 与 r0 对 应 ,vl 和 
rl 对 应 。ARM 指令 adds 实现 了 add-int/2addr 字 节 码 的 功能 。 运 算 结束 后 ,将 运算 结果 存 
回 Dalvik 寄存 器 v0 中 。 

Dalvik JIT 寄存 器 分 配方 案 比较 简单 。 其 主要 方案 是 查找 寄存 器 池 , 如 果 有 寄存 器 没 
有 被 分 配 出 去 ,就 分 配 该 LIR 寄存 器 ,之 后 设置 寄存 器 已 经 被 分 配 。 寄 存 器 池 包 含 的 寄存 
器 主要 有 {r0, rl, r2, r3, r4PC, r7, r8, r9, rl0, rll, r12}。JIT 在 没有 优化 时 ,有 改变 寄 
存 器 值 的 指令 都 应 该 有 取 操 作 数 指令 (load) 和 存储 回 内 存 (store 指令 )。 

如 果 基 本 块 类 型 不 是 代码 块 , 则 需要 进行 特殊 的 处 理 。 这 其 中 也 主要 分 为 两 类 ,分 别 是 
入 口 块 及 出 口 块 和 Chaining Cell。 后 端 对 于 入 口 块 的 处 理 非常 简单 ,如 果 入 口 块 中 有 代码 ， 
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则 和 正常 的 代码 块 一 样 处 理 , 否 则 只 生成 一 个 标签 。 对 于 Chaining Cell ,在 所 有 代码 块 转换 
完成 后 ,遍历 所 有 基本 块 进行 处 理 。 处 理 生 成 的 代码 为 加 载 解释 器 中 的 PC 值 至 r0 寄存 
器 ,在 数据 区 写 人 了 跳 转 回 的 Dalvik 字 节 码 地 址 ,最 后 跳 转 回 解释 器 , 交 由 解释 器 处 理 。 


6.5.2 LIR 转换 为 机 器 码 


内 存 中 以 LIR 指令 号 为 索引 维护 了 一 张 指令 映射 表 EncodingMap (文件 dalvik/vm/ 
compiler/codegen/arm/Assemble. cpp) ,每 一 条 LIR 指令 都 映射 为 其 中 的 ARM 指令 。 
ArmLIR 指令 操作 码 kThumbAddPRR 的 意思 是 相 加 两 个 寄存 器 的 值 并 将 结果 存储 到 寄存 
器 中 ,相对 应 地 在 ARM 中 为 add 指令 ,该 指令 共有 16 位 ,其 中 15 一 9 位 为 操作 码 add,8 一 
6 位 为 源 寄存 器 ,5 一 3 位 为 另 一 个 源 寄存 器 ,2 一 0 位 为 目的 寄存 器 ,指令 格式 如 代码 清 
单 6. 16 所 示 。 

代码 清单 6.16 kThumbAddPRR 格式 


[0001100]zm[8..6lm[5.3]rd[2..0] 
其 在 映射 表 对 应 的 主要 数据 如 表 6.6 所 示 。 
表 6.6 ”kThumbMovImm 指令 映射 表 


ARM 指令 对 应 元 素 kThumbMovImm 对 应 值 说 明 
opcode kThumbAddPRR ARM 操作 码 
skeleton 0x1800 操作 码 对 应 的 十 六 进 制 表示 
k0 kFmtBitBlt 指明 目的 操作 数 有 起 始 和 终止 位 置 
ds 2 目的 操作 数 从 第 2 位 开始 
de 0 目的 操作 数 在 第 0 位 结束 
kl kFmtBitBlt 指明 源 操作 数 有 起 始 和 终止 位 置 
sls 5 第 一 源 操作 数 从 第 5 位 开始 
sle 3 第 二 源 操作 数 在 第 3 位 结束 
s2 kFmtBitBlt 第 二 源 操作 数 
s2s 8 第 二 源 操作 数 从 第 8 位 开始 
s2e 6 第 二 元 操作 数 在 第 6 位 结束 
name Adds 指令 名 称 
Fmt r! 0d, #1!1d 输出 LIR 时 的 格式 


映射 表 以 LIR 中 的 操作 码 为 索引 ,获得 映射 表 中 的 数据 ,操作 码 将 会 转换 成 十 六 进 制 。 同 
时 扫描 所 有 操作 数 , 并 且 操 作 数 也 将 转换 成 十 六 进 制 。 转 换 后 的 操作 码 和 操作 数 合并 ,组 成 一 
条 二 进 制 指令 ,如 图 6. 13 所 示 。 依 次 对 每 一 条 LIR 进行 转换 ,该 过 程 在 dvmCompilerTrace 中 
是 一 个 while 循环 。 

转换 LIR 的 过 程 中 ,需要 注意 的 是 : @ 在 MIR 转换 为 LIR 阶段 ,已 经 规划 好 寄存 器 的 
使 用 ,因而 这 个 过 程 中 不 再 进行 寄存 器 的 分 配 ; 回转 换 之 前 ,需要 计算 每 条 指令 的 偏 移 地 
址 ,同时 需要 保证 4B 对齐。 这 个 过 程 由 assembleInstructions 函数 完成 。 

转换 结束 后 ,需要 在 Tanslation Cache 中 安装 Native Code。 解 释 器 保存 了 Translation 
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Cache 的 起 始 地 址 以 及 已 使 用 大 小 。 现 在 只 需 根 据 两 者 计算 本 次 安装 的 初始 地 址 。Dalvik JIT 
调用 Linux 系统 函数 memcpy 拷贝 编译 好 的 Native Code 至 相应 的 位 置 , 并 更 新 
pJitEntryTable 。 至 此 ,Trace 的 编译 也 就 结束 了 。 


opcode |Operands1|Operands2|Operands3|LIR. 


Encoding Map | 
kArm16BitData 1 1 
| 位 操 位 操 位 操 
kThumbAdcRR \ 作 作 作 
kThumbAddPRR | 
1 1 
-kThumbAddPRR 一 一 0001100 Rm Rm Rd 
15..9 8..6 S33 2..0 
kThumb2Dmb 
kThumb2LdrPcReln12 
kThumbUndefined 


6.13 LIR 转换 为 二 进 制 指令 图 


小 结 


Dalvik JIT 作为 Dalvik VM 的 一 个 子 模块 ,只 和 解释 器 模块 有 耦合 ,内 聚 性 非常 高 。 本 
章 分 为 三 个 部 分 介绍 Dalvik JIT 的 原理 。 首 先 从 宏观 上 介绍 了 Dalvik JIT 的 功能 框架 及 其 
设计 原理 ;接着 模仿 传统 编译 器 ,将 Dalvik JIT 划分 为 前 端 和 后 端 两 部 分 ,分 别 详细 分 析 了 
其 设计 原理 。 


